Лінійне перетворення випадкової величини високою прямокутною матрицею


12

Скажімо, у нас є випадковий вектор , проведений з розподілу з функцією густини ймовірностей . Якщо ми лінійно перетворимо його на повноцінне матрицю щоб отримати , то щільність задаєтьсяXRnfX(x)n×nAY=AXY

fY(y)=1|detA|fX(A1y).

Тепер припустимо, що ми перетворимо X замість цього в m×n матриці B , з m>n , що дає Z=BX . Ясно, що ZRm , але він "живе" на n -вимірному підпросторі GRm . Яка умовна щільність Z , враховуючи, що ми знаємо, що вона лежить у G ?

Мій перший інстинкт повинен був використовувати псевдо-інверсію B . Якщо B=USVT являє собою розкладання по сингулярним значення B , то B+=VS+UT є псевдообернених, де S+ утворюється інвертуванням ненульових елементів діагональної матриці S . Я здогадувався, що це дасть

fZ(z)=1|det+S|fX(B+z),
де під det+S я маю на увазі добуток ненульових сингулярних значень.

Це міркування узгоджується з щільністю для сингулярного нормального (обумовленого знанням про те, що змінна живе у відповідному підпросторі), наведеного тут і згаданого також тут і в цьому крос-валідованому дописі .

Але це не правильно! Константа нормалізації вимкнена. (Тривіальний) контрприклад наведено, розглядаючи такий випадок: З XN(0,1) , нехай

Y=(11)X=(XX).
Тут матриця B зверху є лише тими векторами. Його псевдоінверсія -
B+=(1/21/2)
і det+B=2 . Міркування зверху пропонують
fY(y)=12π2exp(12yT(B+)TB+y),
але це насправді інтегрується (у рядку y=x ) до 12. Я усвідомлюю, що в цьому випадку ви можете просто залишити один із записів який ви закінчили, але коли набагато більший, ідентифікуючи набір записів, які потрібно відкинути, це дратує. Чому псевдо-зворотні міркування не спрацьовують? Чи існує загальна формула функції густини лінійного перетворення множини випадкових величин за допомогою "високої" матриці? Будь-які посилання також будуть дуже вдячні. BYB

Відповіді:


2

Для тих, хто може зіткнутися з цим у майбутньому ... джерело помилки насправді випливає з інтеграції. У наведеному вище прикладі інтеграція відбувається через лінію . Тому необхідно "параметризувати" рядок і врахувати якобіан параметризації при взятті інтеграла, оскільки кожен одиничний крок у -осі відповідає крокам довжини на лінії. Параметризація, яку я неявно використовував, була надана , іншими словами вказуючи обидва однакові записи за значенням. Це Jacobian , який акуратно скасовується за допомогоюxy=xx x(x,x)y2x(x,x)y22 (походить від точно того ж якобіанця) у знаменнику.

Приклад був штучно простим - для загального перетворення може бути інша параметризація для виходу, що є природним у контексті проблеми. Оскільки параметризация повинна охоплювати той же підпростір як , і це підпростір гиперплоскости, параметризація сам по собі , ймовірно, буде лінійною. Викликаючи матричне представлення параметризації параметризації , вимога полягає просто в тому, щоб він мав той самий простір стовпців, що і (покриває ту саму гіперплощину). Тоді кінцева щільність стаєG B m × n L B f Z ( z ) = | det + L |BGBm×nLB

fZ(z)=|det+L||det+B|fX(B+z).

Взагалі, ця настройка є якоюсь дивною, і я думаю, що правильне робити - це знайти максимально лінійно незалежний набір рядків і видалити решту рядків (разом із відповідними компонентами перетвореної змінної ) , щоб отримати квадратну матрицю . Тоді проблема зводиться до повноцінного випадку (якщо має повний ранг стовпця).Z У п × п ВBzB^n×nB

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.