Алгоритм PCA можна сформулювати за допомогою кореляційної матриці (припустимо, що дані вже нормалізовані, і ми розглядаємо лише проекцію на перший ПК). Цільову функцію можна записати так:
Це добре, і для його вирішення використовуємо множники Лагрангія, тобто переписуємо їх як:
що еквівалентно
і, отже, ( див. тут на Mathworld ), схоже, дорівнює
Але це говорить про те, щоб збільшити відстань між точкою та прямою, і з того, що я тут прочитав , це неправильно - це має бути , а не . Де моя помилка?
Або може мені хтось показати зв’язок між максимізацією дисперсії в прогнозованому просторі та мінімізацією відстані між точкою та лінією?