Am×nm≥nvAv1=argmaxv∈Rn∥Av∥2subject to ∥v∥2=1.(1)
v1Av2=argmaxv∈Rn∥Av∥2subject to ⟨v1,v⟩=0,∥v∥2=1.
v1,…,vnRnRnA
Нехай (так кількісно визначає вибухову силу у напрямку ). Припустимо, що одиничні вектори визначені так, що
Рівняння (2) можна виразити стисло, використовуючи позначення матриці як
де - матриця , й стовпець , - матриця , стовпець - це , іσi=∥Avi∥2σiAviuiAvi=σiuifor i=1,…,n.(2)
AV=UΣ,(3)
Vn×niviUm×niuiΣ- діагональна матриця , - діагональна запис - . Матриця є ортогональною, тому ми можемо помножити обидві сторони (3) на щоб отримати
Може здатися, що зараз ми отримали SVD з майже нульовим зусиллям. Жоден із кроків поки що не був складним. Однак вирішальний фрагмент картини відсутній - ми ще не знаємо, що є ортогональним.n×niσiVVTA=UΣVT.
AU
Ось найважливіший факт, відсутній фрагмент: виявляється, що є ортогональним :
Я стверджую, що якби це не було правдою, то не було б оптимальним для проблеми (1). Дійсно, якби (4) не були задоволені, то можна було б покращити , потурбувавши його трохи у напрямку .Av1Av2⟨Av1,Av2⟩=0.(4)
v1 v1v2
Припустимо (для суперечності), що (4) не виконується. Якщо обурений трохи в ортогональному напрямку , норма не змінюється (або, принаймні, зміна норми є незначною). Коли я ходжу по поверхні землі, моя відстань від центру землі не змінюється. Однак, коли обурений у напрямку , вектор обурений в неортогональному напрямку , і тому зміна норми є незначним . Нормаv1v2v1v1v1v2Av1Av2Av1Av1може бути збільшена на незначну кількість. Це означає, що не є оптимальним для проблеми (1), що є протиріччям. Мені подобається цей аргумент, тому що: 1) інтуїція дуже чітка; 2) інтуїція може бути перетворена безпосередньо в суворий доказ.v1
Аналогічний аргумент показує, що є ортогональним як для і для тощо. Вектори попарно ортогональні. Це означає, що одиничні вектори можна вибрати ортогональними, а це означає, що матриця вище є ортогональною матрицею. Це завершує наше відкриття SVD.Av3Av1Av2Av1,…,Avnu1,…,unU
Щоб перетворити вищезазначений інтуїтивний аргумент у суворий доказ, ми маємо протистояти тому, що якщо обурений у напрямку , збурений вектор
насправді не є одиничним вектором. (Його норма - .) Щоб отримати суворий доказ, визначте
Вектор справді одиничний вектор. Але як ви легко можете показати, якщо (4) не задоволено, то для досить малих значень маємо
(припустимо, що знакv1v2v~1=v1+ϵv2
1+ϵ2−−−−−√v¯1(ϵ)=1−ϵ2−−−−−√v1+ϵv2.
v¯1(ϵ)ϵf(ϵ)=∥Av¯1(ϵ)∥22>∥Av1∥22
ϵобрано правильно). Щоб показати це, просто перевірте, що . Це означає, що не є оптимальним для проблеми (1), що є протиріччям.f′(0)≠0v1
(До речі, я рекомендую ознайомитись із поясненням ЦДАочу Юану щодо СВД тут . Зокрема, погляньте на "Ключову лему № 1", про що ми говорили вище. Як каже Цяочу, ключова лема № 1 - "технічне серце" сингулярного розкладання значення ".)