Як знайти відхилення між багатовимірними точками?


12

Припустимо, у мене є матриця X, яка n на p, тобто вона має n спостережень, з кожним спостереженням у p-мірному просторі.

Як я можу знайти дисперсію цих російських спостережень?

У випадку, коли p = 1, мені просто потрібно використовувати звичайну формулу дисперсії. Як щодо випадків, коли p> 1.

Відповіді:


18

Для -вимірної випадкової величини маємо таке визначення дисперсії:pX=(X1,,Xp)

Var(X)=E[(XEX)(XEX)]=(Var(X1)Cov(X1,Xp)Cov(Xp,X1)Var(Xp))

Тобто дисперсія випадкового вектора визначається як матриця, яка зберігає всі дисперсії на головній діагоналі та коваріації між різними компонентами в інших елементах. Зразок ковариационная матриця буде потім обчислюється шляхом підключення зразків аналогів для демографічних змінних:p×p

1n1(i=1n(Xi1X¯1)2i=1n(Xi1X¯1)(XipX¯p)i=1n(XipX¯p)(Xi1X¯1)i=1n(XipX¯p)2)
де позначає е спостереження для функції і середнє значення вибіркиXijijX¯jjй особливість. Підсумовуючи, дисперсія випадкового вектора визначається як матриця, що містить окремі дисперсії та коваріації. Тому досить обчислити вибіркові дисперсії та коваріації для всіх векторних компонентів окремо.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.