При обчисленні коваріаційної матриці вибірки гарантується тоді отримання симетричної та визначеної позитивної матриці?
Наразі моя проблема має вибірку з 4600 векторів спостереження та 24 виміри.
При обчисленні коваріаційної матриці вибірки гарантується тоді отримання симетричної та визначеної позитивної матриці?
Наразі моя проблема має вибірку з 4600 векторів спостереження та 24 виміри.
Відповіді:
Для вибірки векторів , з , середній вектор вибірки
і матриця зразкової коваріації дорівнює
Для ненульового вектора , маємо
Тому завжди позитивний напіввизначений .
Додаткова умова, щоб було позитивним, визначено нижче в коментарях Ваубера. Виходить так.
Визначте , для . Для будь-якого ненульового значення , дорівнює нулю, якщо і лише тоді, коли , для кожного . Припустимо, набір прольоти . Тоді є дійсні числа такі, що . Але тоді маємо , даючи, що , суперечність. Отже, якщо 'span , то n y = 0 y = 0 z i R k Qє позитивним певним . Ця умова еквівалентна .
Правильна ковариационная матриця завжди симетрична і позитивно * підлозі * визначена.
Коваріація між двома змінними зазначається як .
Це рівняння не змінюється, якщо ви переключите положення і . Отже, матриця повинна бути симетричною.
Він також повинен бути позитивним * напів- * певним, тому що:
Ви завжди можете знайти перетворення змінних таким чином, що матриця коваріації стає діагональною. На діагоналі ви знаходите відхилення ваших перетворених змінних, які є нульовими або позитивними, легко помітити, що це робить позитивний перетворений матричний напівдефініт. Однак, оскільки визначення визначеності є інваріантним перетворенням, то випливає, що матриця коваріації є позитивною напівдефінітом у будь-якій обраній системі координат.
Коли ви оціните матрицю коваріації (тобто під час обчислення вашої вибіркової коваріації ) за формулою, яку ви вказали вище, вона буде непридатною. як і раніше бути симетричними. Це також повинно бути позитивним напівдефінітом (я думаю), тому що для кожного зразка pdf, що дає кожній вибірковій точці рівну ймовірність, зразок коваріації є його коваріацією (хтось, будь ласка, перевірте це), тому все, що зазначено вище, все ще застосовується.
Варіантно-коваріаційні матриці завжди симетричні, як це можна довести з фактичного рівняння для обчислення кожного члена зазначеної матриці.
Також матриці Variance-Covariance - це завжди квадратні матриці розміру n, де n - кількість змінних у вашому експерименті.
Власні вектори симетричних матриць завжди ортогональні.
За допомогою PCA ви визначаєте власні значення матриці, щоб побачити, чи зможете ви зменшити кількість змінних, використаних у вашому експерименті.
До приємного аргументу Дзен я додам наступне, що пояснює, чому ми часто кажемо, що коваріаційна матриця є позитивно визначеною, якщо .
Якщо являють собою випадкову вибірку з безперервного розподілу ймовірностей , то х 1 , х 2 , . . . , x n майже напевно (в сенсі теорії ймовірностей) лінійно незалежні. Тепер, г 1 , г 2 , . . . , z n не є лінійно незалежними, оскільки ∑ n i = 1 z i = , але через те, щоє лінійно незалежними,як span. Якщо, вони також охоплюють.г 1 , г 2 , . . . , z n R n - 1 n - 1 ≥ k R k
На закінчення, якщо є випадковою вибіркою безперервного розподілу ймовірностей і , матриця коваріації є певною позитивною. n - 1 ≥ k
Для тих, хто не має математичного походження, як я, які не швидко вловлюють абстрактні математичні формули, це відпрацьований приклад відмінного варіанту для найбільш прийнятної відповіді. Матриця коваріації може бути отримана і іншими способами.