Підхід FastICA вимагає попереднього відбілювання: дані спочатку трансформуються за допомогою PCA, що призводить до діагональної коваріаційної матриці, а потім кожен вимір нормалізується таким чином, що матриця коваріації дорівнює матриці тотожності (відбілювання).
Існують нескінченні перетворення даних, які призводять до матриці коваріації ідентичності, і якби ваші джерела були гауссовими, ви зупинилися б на цьому (для багатоваріантних розподілів Гаусса середнє значення та коваріація є достатньою статистикою), за наявності неа-гауссових джерел ви можете мінімізувати деякі міра залежності від побілених даних, тому ви шукаєте обертання побілених даних, що забезпечує максимальну незалежність. FastICA досягає цього за допомогою інформаційно-теоретичних заходів та схеми ітерації з фіксованою точкою.
Я рекомендую роботу Hyvärinen, щоб глибше зрозуміти проблему:
- А. Hyvärinen. Швидкі та надійні алгоритми з фіксованою точкою для незалежного аналізу компонентів. Операції IEEE в нейронних мережах 10 (3): 626-634, 1999.
- А. Hyvärinen, J. Karhunen, E. Oja, Незалежний аналіз компонентів, Wiley & Sons. 2001 рік
Зверніть увагу, що робити PCA та зменшувати розміри - це не те саме: коли у вас більше спостережень (за сигнал), ніж сигналів, ви можете виконати PCA, зберігаючи 100% поясненої дисперсії, а потім продовжити відбілювання та ітерацію з фіксованою точкою. для отримання оцінки незалежних компонентів. Від того, чи слід проводити зменшення розмірів, чи ні, це дуже залежить від контексту, і це базується на ваших припущеннях моделювання та розподілі даних.