Чому матриця коваріації вибірки є сингулярною, коли розмір вибірки менше числа змінних?


30

Скажімо, у мене p -вимірне багатовимірне гауссове розподіл. І я беру n спостереження (кожен з них p -векторних) від цього розподілу і обчислити зразок ковариационной матриці S . У цій роботі автори констатують, що матриця коваріації вибірки, обчислена з p>n є сингулярною.

  • Як це правда чи похідне?
  • Будь-які пояснення?

4
Зауважте, що це дійсно незалежно від основного розподілу: він не повинен бути гауссом.
Амеба каже: Відновити Моніку

Відповіді:


22

Деякі факти про матричні ранги, пропоновані без доказів (але докази всіх або майже всіх вони повинні бути надані в стандартних текстах лінійної алгебри, або в деяких випадках встановлені як вправи після надання достатньої кількості інформації, щоб мати можливість це зробити):

Якщо A і B - дві сумісні матриці, то:

(i) рядок стовпця A = рядок рядка A

(ii) rank(A)=rank(AT)=rank(ATA)=rank(AAT)

(iii) rank(AB)min(rank(A),rank(B))

(iv) rank(A+B)rank(A)+rank(B)

(v) якщо B - квадратна матриця повного рангу, то rank(AB)=rank(A)

Розглянемо матрицю зразкових даних, . З вищесказаного ранг становить щонайбільше .n×pyymin(n,p)

Далі, з вищезазначеного чітко ранг не буде більшим за ранг (якщо врахувати обчислення у матричній формі, можливо, з деяким спрощенням).SyS

Якщо то в такому випадку .n<prank(y)<prank(S)<p


приємна відповідь! Не зовсім зрозуміло, однак, як y і S співвідносяться з A і B?
Матифу

S обчислюється з у; ("x" у початковій публікації). Ви можете використовувати факти про y та маніпуляції, зроблені на ньому (за допомогою вищезазначених правил), щоб встановити обмеження на ранг S. Ролі, які грають A і B, змінюються від кроку до кроку.
Glen_b -Встановити Моніку

14

Коротка відповідь на ваше запитання - це ранг . Отже, якщо , то є одниною.(S)n1p>nS

Для більш детальної відповіді нагадаємо, що (неупереджена) матриця коваріації вибірки може бути записана як

S=1n1i=1n(xix¯)(xix¯)T.

Ефективно ми підсумовуємо матриць, кожна з яких має ранг 1. Якщо припустити, що спостереження лінійно незалежні, у певному сенсі кожне спостереження вносить 1 у ранг , а 1 віднімається з рангу (якщо ) тому що ми зосереджуємо кожне спостереження за . Однак якщо в спостереженнях присутня мультиколінеарність , то ранг може бути знижений, що пояснює, чому ранг може бути меншим за .nxi(S)p>nx¯(S)n1

Велика кількість робіт була спрямована на вивчення цієї проблеми. Наприклад, мій колега написав документ на цю ж тему, де нам було цікаво визначити, як діяти, якщо є сингулярним при застосуванні до лінійного дискримінантного аналізу в налаштуваннях .Spn


4
Чи можете ви, будь ласка, детальніше розібратися,x¯ чому віднімаємо 1, оскільки ми зосереджуємо кожне спостереження за ?
авокадо


Гарна відповідь! Може, можна просто додати пояснення / посилання на те, що твердження, яке ми підсумовуємо 𝑛 матриці, кожна з яких має ранг 1 ? Спасибі!
Матифу

10

Коли ви дивитесь на ситуацію правильним шляхом, висновок є інтуїтивно зрозумілим та негайним.

Цей пост пропонує дві демонстрації. Перший, одразу нижче, - на словах. Він еквівалентний простому малюнку, з'являється в самому кінці. Між ними - пояснення того, що означають слова та малюнок.


Матриця коваріації для варіантних спостережень - це матриця обчислена шляхом лівого множення матриці (переглянуті дані) шляхом її переміщення . Цей добуток матриць посилає вектори через трубопровід векторних просторів, у яких розміри і . Отже, матриця коваріації, ква лінійне перетворення, посилає у підпростір, розмірність якого не більше . Одразу ж ранг коваріаційної матриці не перевищує . Отже, якщоn pp×pXnpXpnpnRnmin(p,n)min(p,n)p>n то ранг не більше , що - будучи строго меншим за - означає матрицю коваріації є сингулярною.np

Вся ця термінологія повністю пояснена в решті цього посту.

(Як доброзичливо зазначив Амеба у видаленому коментарі та показує у відповіді на відповідне запитання , зображення насправді лежить у підпросторі кодування-один (складається з векторів, чиї складові дорівнюють нулю), оскільки всі його стовпці були переглянуті на нуль, тому ранг вибіркової коваріаційної матриці не може перевищувати )XRn1n1XXn1


Лінійна алгебра стосується відстеження розмірів векторних просторів. Потрібно лише оцінити кілька фундаментальних концепцій, щоб мати глибоку інтуїцію тверджень про ранг та особливості:

  1. Матричне множення являє собою лінійні перетворення векторів. An матриці є лінійне перетворення з - мірного простору до - вимірному просторі . Зокрема, він надсилає будь-які до . Те, що це лінійне перетворення, випливає безпосередньо з визначення лінійного перетворення та основних арифметичних властивостей множення матриць.m×nMnVnmVmxVnMx=yVm

  2. Лінійні перетворення ніколи не можуть збільшувати розміри. Це означає, що зображення всього векторного простору при перетворенні (що є підвекторним простором ) може мати розмір не більше . Це (легка) теорема, яка випливає з визначення розмірності.VnMVmn

  3. Розмір будь-якого субвекторного простору не може перевищувати розміру простору, в якому він лежить. Це теорема, але знову це очевидно і легко довести.

  4. Оцінка лінійного перетворення є розмірність його образу. Ранг матриці - це ранг лінійної трансформації, яку вона представляє. Це визначення.

  5. Сингулярним матриця має ранг строго меншеMmnn (розмірність своєї області). Іншими словами, його зображення має менший вимір. Це визначення.

Розвивати інтуїцію, це допомагає бачити розміри. Тому я напишу розміри всіх векторів і матриць відразу після них, як у і . Таким чином, загальна формулаMmnxn

ym=Mmnxn

Мається на увазі, що матриця при застосуванні до вектора виробляє -вектор .m×nMnxmy

Продукти матриць можна розглядати як "трубопровід" лінійних перетворень. В загальному, припустимо , що є - мірний вектор в результаті послідовних застосувань лінійних перетворень і до вектора йде з простору . Це приймає вектор послідовно через набір векторних просторів розмірів і, нарешті, .yaaMmn,Llm,,Bbc,AabnxnVnxnm,l,,c,b,a

Подивіться на вузьке місце : оскільки розміри не можуть збільшуватися (точка 2), а підпростори не можуть мати розміри, більші за проміжки, в яких вони лежать (точка 3), випливає, що розмірність зображення не може перевищувати найменшого розміру зустрічаються в трубопроводі.Vnmin(a,b,c,,l,m,n)


Тоді ця діаграма конвеєра повністю доводить результат, коли він застосовується до продукту :XX

! [введіть тут опис зображення

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.