Чи завжди матриця коваріації вибірки симетрична і позитивна?


33

При обчисленні коваріаційної матриці вибірки гарантується тоді отримання симетричної та визначеної позитивної матриці?

Наразі моя проблема має вибірку з 4600 векторів спостереження та 24 виміри.


Для вибірки матриці коваріації я використовую формулу: де - кількість вибірок, а - середня вибірка. п ˉ хQn=1ni=1n(xix¯)(xix¯)nx¯
Мортен

4
Це зазвичай називається "обчислення матриці коваріації вибірки", або "оцінка матриці коваріації", а не "вибірка матриці коваріації".
Glen_b -Встановіть Моніку

1
Поширена ситуація, в якій матриця коваріації не є визначеною, коли 24 "розміри" записують склад суміші, який становить 100%.
whuber

Відповіді:


41

Для вибірки векторів , з , середній вектор вибірки і матриця зразкової коваріації дорівнює Для ненульового вектора , маємо Тому завжди позитивний напіввизначений .xi=(xi1,,xik)i=1,,n

x¯=1ni=1nxi,
Q=1ni=1n(xix¯)(xix¯).
yRk
yQy=y(1ni=1n(xix¯)(xix¯))y
=1ni=1ny(xix¯)(xix¯)y
=1ni=1n((xix¯)y)20.()
Q

Додаткова умова, щоб було позитивним, визначено нижче в коментарях Ваубера. Виходить так.Q

Визначте , для . Для будь-якого ненульового значення , дорівнює нулю, якщо і лише тоді, коли , для кожного . Припустимо, набір прольоти . Тоді є дійсні числа такі, що . Але тоді маємо , даючи, що , суперечність. Отже, якщо 'span , тоzi=(xix¯)i=1,,n n y = 0 y = 0 z i R k QyRk()ziy=0i=1,,n{z1,,zn}Rkα1,,αny=α1z1++αnznyy=α1z1y++αnzny=0y=0ziRkQє позитивним певним . Ця умова еквівалентна .rank[z1zn]=k


2
Мені подобається такий підхід, але я б порадив трохи дбати: не обов'язково є позитивним. (Необхідні та достатні) умови для цього описані в моєму коментарі до відповіді Костянтина. Q
whuber

1
Оскільки ранг менший або дорівнює , умова може бути спрощена до рангу, рівного k. k[z1,z2,,zn]k
пропозиція не може відмовити

13

Правильна ковариационная матриця завжди симетрична і позитивно * підлозі * визначена.

Коваріація між двома змінними зазначається як .σ(x,y)=E[(xE(x))(yE(y))]

Це рівняння не змінюється, якщо ви переключите положення і . Отже, матриця повинна бути симетричною.xy

Він також повинен бути позитивним * напів- * певним, тому що:

Ви завжди можете знайти перетворення змінних таким чином, що матриця коваріації стає діагональною. На діагоналі ви знаходите відхилення ваших перетворених змінних, які є нульовими або позитивними, легко помітити, що це робить позитивний перетворений матричний напівдефініт. Однак, оскільки визначення визначеності є інваріантним перетворенням, то випливає, що матриця коваріації є позитивною напівдефінітом у будь-якій обраній системі координат.

Коли ви оціните матрицю коваріації (тобто під час обчислення вашої вибіркової коваріації ) за формулою, яку ви вказали вище, вона буде непридатною. як і раніше бути симетричними. Це також повинно бути позитивним напівдефінітом (я думаю), тому що для кожного зразка pdf, що дає кожній вибірковій точці рівну ймовірність, зразок коваріації є його коваріацією (хтось, будь ласка, перевірте це), тому все, що зазначено вище, все ще застосовується.


1
PS: Я починаю думати, що це не ваше питання ...
Костянтин Шуберт

Але якщо ви хочете знати, чи гарантує це ваш алгоритм вибірки, вам доведеться вказати, як ви здійснюєте вибірку.
Костянтин Шуберт

1
Мортен, симетрія безпосередньо від формули. Щоб показати , вам потрібно встановити, що для будь-якого вектора . Але в разів перевищує суму (де , звідки - це сума = , яка - довжина квадрата вектора . Оскільки і сума квадратів ніколи не можуть бути негативними, , QED . Це також показує, що саме для цих векторівu Q n 1 / n v i v i Q n u 0uQnu0uQn1/nviviп у Q п у ' у ( v я v ' я ) у ' ( U V я ) ( U v i ) u v i n > 0 uvi=xix¯)nuQnuu(vivi)u(uvi)(uvi)uvin>0uQnu0u v i u v i = 0 i v i u = 0 Q nuQnu=0uякі є ортогональними для всіх ( тобто , для всіх ). Коли проміжок , то і є визначеним. viuvi=0iviu=0Qn
whuber

1
@Morten Інваріантність перетворень досить чітка, якщо ви розумієте множення матриць геометрично. Подумайте про свій вектор як про стрілку. Числа, що описують ваш вектор, змінюються за допомогою системи координат, але напрямок і довжина вектора не роблять. Тепер множення на матрицю означає, що ви змінюєте довжину та напрямок цієї стрілки, але знову ж таки ефект геометрично однаковий у кожній системі координат. Те саме відбувається зі скалярним твором: він визначається геометрично, а Геометрій є інваріантним перетворенням. Отже, ваше рівняння має однаковий результат у всіх системах.
Костянтин Шуберт

1
@Morten Коли ви думаєте про координати, аргумент іде так: Коли - ваша матриця перетворення, тоді: з як перетворений вектор координат, , тому коли ви перетворюєте кожен елемент у рівняння , ви отримуєте , що дорівнює , і, оскільки A є ортогональним, - одинична матриця, і ми знову отримуємо , а це означає, що перетворене і неперетворене рівняння мають однаковий скалярний результат, тому їхні або обидва, і обидва не більше нуля. v = A v v M > 0Av=Avvv T M v > 0 v T M v = ( A v ) T A M A T A v > 0 v T A T A M A T A v > 0 A T A v T M vM=AMATvTMv>0vTMv=(Av)TAMATAv>0vTATAMATAv>0ATAvTMv>0
Костянтин Шуберт

0

Варіантно-коваріаційні матриці завжди симетричні, як це можна довести з фактичного рівняння для обчислення кожного члена зазначеної матриці.

Також матриці Variance-Covariance - це завжди квадратні матриці розміру n, де n - кількість змінних у вашому експерименті.

Власні вектори симетричних матриць завжди ортогональні.

За допомогою PCA ви визначаєте власні значення матриці, щоб побачити, чи зможете ви зменшити кількість змінних, використаних у вашому експерименті.


1
Зауважте, генерал. Зверніть увагу, що ваше ім'я користувача, ідентифікатор та посилання на вашу сторінку користувача автоматично додаються до кожної публікації, яку ви створюєте, тому немає необхідності підписувати свої повідомлення.
Антуан Вернет

3
Цю відповідь можна було б покращити, вирішивши питання позитивної визначеності
Silverfish

Це насправді не відповідає на питання: це лише сукупність непідтримуваних тверджень, які можуть бути або не бути актуальними. Чи могли б ви переробити це таким чином, що показує, як відповіли на запитання та пояснює міркування?
whuber

0

До приємного аргументу Дзен я додам наступне, що пояснює, чому ми часто кажемо, що коваріаційна матриця є позитивно визначеною, якщо .n1k

Якщо являють собою випадкову вибірку з безперервного розподілу ймовірностей , то х 1 , х 2 , . . . , x n майже напевно (в сенсі теорії ймовірностей) лінійно незалежні. Тепер, г 1 , г 2 , . . . , z n не є лінійно незалежними, оскільки n i = 1 z i =x1,x2,...,xnx1,x2,...,xnz1,z2,...,zn , але через те, щоє лінійно незалежними,як span. Якщо, вони також охоплюють.i=1nzi=0г 1 , г 2 , . . . , z n R n - 1 n - 1 k R kx1,x2,...,xnz1,z2,...,znRn1n1kRk

На закінчення, якщо є випадковою вибіркою безперервного розподілу ймовірностей і , матриця коваріації є певною позитивною. n - 1 kx1,x2,...,xnn1k


0

Для тих, хто не має математичного походження, як я, які не швидко вловлюють абстрактні математичні формули, це відпрацьований приклад відмінного варіанту для найбільш прийнятної відповіді. Матриця коваріації може бути отримана і іншими способами.

введіть тут опис зображення

введіть тут опис зображення


Чи можете ви пояснити, як ця електронна таблиця демонструє позитивну визначеність матриці коваріації?
whuber

Це не. Мені важко було візуалізувати матрицю коваріації в її нотаційній формі. Тому я створив цей аркуш для себе і подумав, що він може комусь допомогти.
Парикшит Бхінде

Потім відредагуйте його, щоб включити відповідь на запитання.
whuber

Готово :) Дякую за пропозицію.
Парикшит Бхінде

Питання в тому, "чи гарантовано тоді отримати симетричну і визначену позитивом матрицю?" Я не в змозі сприймати жоден елемент вашої публікації, який стосується цього, оскільки (1) він ніколи не ідентифікує коваріаційну матрицю; (2) вона не демонструє позитивної визначеності нічого.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.