Обмежена максимальна ймовірність із меншим, ніж повним рангом стовпця


14

Це питання стосується оцінки обмеженої максимальної вірогідності (REML) у певній версії лінійної моделі, а саме:

Y=X(α)β+ϵ,ϵNn(0,Σ(α)),

де - матриця ( ), параметризована , як і . - невідомий вектор неприємних параметрів; інтерес полягає в оцінці , і ми маємо . Оцінка моделі за максимальною вірогідністю не є проблемою, але я хочу використовувати REML. Добре відомо, див., Наприклад, Ламотт , що ймовірність , де - будь-яка напів-ортогональна матриця така, що можна записатиX(α)n×pαRkΣ(α)βαkpnAYAAX=0

LREML(αY)|XX|1/2|Σ|1/2|XΣ1X|1/2exp{12rΣ1r},r=(IX(XΣ1X)+XΣ1)Y,

коли X - повна колона рангів .

Моя проблема полягає в тому, що для деяких ідеально розумних і науково цікавих, α матриця X(α) не має повного рангового стовпця. Всі висновки , які я бачив в обмеженою ймовірності вище використовує детермінантних равенствами, які не застосовні при |XX|=0 , тобто вони беруть на себе повний ранг стовпця X . Це означає, що вищевказана обмежена ймовірність є правильною лише для мого налаштування на частини простору параметрів, і, отже, це не те, що я хочу оптимізувати.

Питання: Чи існують більш загальні обмежені ймовірності, виведені в статистичній літературі чи в інших місцях, без припущення, що X є повним рангом стовпців? Якщо так, як вони виглядають?

Деякі зауваження:

  • Виведення експоненціальної частини не є проблемою для жодного і воно може бути записане у зворотному напрямку Мура-Пенроуза, як описано вищеX(α)
  • Стовпці - це (будь-яка) ортонормальна основа дляC ( X ) AC(X)
  • Для відомого ймовірність може бути легко записана для кожного , але, звичайно, кількість базових векторів, тобто стовпців, в залежить від стовпцяA Y α A XAAYαAX

Якщо хтось, хто цікавиться цим питанням, вважає, що точна параметризація допоможе, дайте мені знати, і я запишу їх. На даний момент мене найбільше цікавить REML для загального правильних розмірів.XX,Σ X


Більш детальний опис моделі випливає тут. Нехай - -вимірний векторний авторегресія першого порядку [VAR (1)], де . Припустимо, процес запускається в якомусь фіксованому значенні в момент .r v t i i d N ( 0 , Ω ) y 0 t = 0yt=μ+Ayt1+vt,t=1,,TrvtiidN(0,Ω)y0t=0

Визначте . Модель може бути записана у формі лінійної моделі використовуючи такі визначення та позначення: Y = X β + εY=[y1,,yT]Y=Xβ+ε

X=[1TIr,C1B]β=[μ,y0μ]var(ε)1=C(ITΩ1)CC=[Ir00AIr00AIr]B=e1,TA,

де позначає мірний вектор з одиниць і перший стандарт базисний вектор . T - e 1 , T R T1TTe1,TRT

Позначимо . Зауважте, що якщо не повний ранг, то не є повним рангом стовпця. Це включає, наприклад, випадки, коли один із компонентів не залежить від минулого.A X ( α ) y tα=vec(A)AX(α)yt

Ідея оцінки VAR за допомогою REML добре відома, наприклад, в літературі про прогнозування регресії (див., Наприклад, Phillips and Chen та посилання на неї).

Можливо, варто уточнити, що матриця не є дизайнерською матрицею у звичайному розумінні, вона просто випадає з моделі, і якщо немає апріорних знань про , наскільки я не можу сказати, немає можливості перераметомеризувати це буде повний ранг.XA


Я розмістив запитання на math.stackexchange, яке пов'язане з цим, в тому сенсі, що відповідь на математичне питання може допомогти визначити ймовірність, яка відповість на це питання.


1
Можливо, одним із способів вирішити питання є запитати, що відбувається в лінійних змішаних моделях, коли матриця моделі не є повною мірою стовпця?
Грінпаркер

Дякуємо за нагороду @Greenparker. І так, якщо обмежена ймовірність могла бути записана для лінійної змішаної моделі з меншою, ніж повною мірою, матрицею дизайну фіксованих ефектів рангового стовпця, це допоможе.
еквалл

Відповіді:


2

Виведення експоненціальної частини не є проблемою для жодного X (α) X (α), і це може бути записано у зворотному напрямку Мура-Пенроуза, як описано вище

Я сумніваюся, що це спостереження є правильним. Узагальнене обернене фактично поставило додаткове лінійне обмеження на ваші оцінки [Рао та Мітра], тому нам слід розглядати спільну ймовірність у цілому, а не здогадуватися, що "інверсія Мура-Пенроуза працюватиме за експоненціальну частину". Це здається формально правильним, але ви, мабуть, неправильно розумієте змішану модель.

(1) Як правильно мислити моделі змішаних ефектів?

Ви повинні по-іншому подумати про модель змішаного ефекту, перш ніж намагатися механічно підключити g-інверсію (АБО інверсія Мура-Пенроуза, яка є особливим видом рефлексивного g-інверсії [Rao & Mitra]) у формулу, задану RMLE (обмежений) Оцінювач максимальної ймовірності, те саме нижче.)

X=(fixedeffectrandomeffect)

Поширений спосіб мислення змішаного ефекту полягає в тому, що частина випадкового ефекту в проектній матриці вводиться помилкою вимірювання, яка носить іншу назву "стохастичний предиктор", якщо нас більше хвилює прогнозування, а не оцінка. Це також одна історична мотивація вивчення стохастичної матриці при встановленні статистики.

Моя проблема полягає в тому, що для деякого цілком розумного і науково цікавого αα матриця X (α) X (α) не є повною в ранжирі стовпців.

Враховуючи ймовірність такого способу мислення, ймовірність того, що не є повноцінним, дорівнює нулю. Це тому, що визначальна функція є неперервною у записах матриці, а нормальний розподіл - це безперервний розподіл, який присвоює нульовій ймовірності одній точці. Ймовірність дефектного ранжу є позитивною, якщо ви параметризували його таким патологічним способом, як .X ( α ) ( α α α αX(α)X(α)(ααααrandomeffect)

Тож рішення вашого питання також досить прямо вперед, ви просто заважаєте матриці дизайну (турбує лише частину фіксованого ефекту), і використовуйте збурену матрицю (яка є повною мірою) для здійснення всіх похідних. Якщо ваша модель не має складних ієрархій або є поруч сингулярним, я не бачу, що існує серйозна проблема, коли ви берете в кінцевий результат, оскільки визначальна функція є безперервною, і ми можемо взяти межа всередині визначальної функції. . А в збуренні утворюють оберненуXϵ(α)=X(α)+ϵ(I000)Xϵ0limϵ0|Xϵ|=|limϵ0Xϵ|Xϵможе бути отримана теоремою Шермана-Моріссіона-Вудбері. А детермінанта матриці наведена в стандартній лінійній книзі алгебри типу [Хорн та Джонсон]. Звичайно, ми можемо записати визначник з точки зору кожного запису матриці, але обурення завжди віддається перевазі [Горн та Джонсон].I+X

(2) Як ми маємо мати справу з параметрами неприємностей у моделі?

Як бачите, для розгляду частини випадкового ефекту в моделі ми повинні розглядати це як свого роду "параметр неприємності". Проблема полягає в тому, чи є RMLE найбільш підходящим способом усунення параметра неприємності? Навіть у моделях GLM та змішаних ефектів, RMLE далеко не єдиний вибір. [Басу] вказував, що багато інших способів усунення параметрів при встановленні оцінки. Сьогодні люди схильні вибирати між моделями RMLE та Bayes, оскільки вони відповідають двом популярним комп'ютерним рішенням: EM та MCMC відповідно.

На мою думку, безумовно, більше підходить ввести пріоритет у ситуації дефектного рангу у частині фіксованого ефекту. Або ви можете перевзначити модель для того, щоб перетворити її в повний ранг.

Крім того, у випадку, якщо ваш фіксований ефект не має повного рангу, ви можете потурбуватися вище неправильно заданої структури коваріації, оскільки ступінь свободи у фіксованих ефектах повинна перейти в частину помилки. Щоб зрозуміти цей момент більш чітко, ви можете розглянути MLE (також LSE) для GLS (Загальний найменший сквер) де - структура коваріації терміна помилки для випадку, коли не є повним рангом.β^=(XΣ1X)1Σ1yΣX(α)

(3) Подальші коментарі

Проблема полягає не в тому, як ви модифікуєте RMLE, щоб він працював у тому випадку, якщо частина матриці з фіксованим ефектом не є повною; проблема полягає в тому, що в такому випадку ваша модель може бути проблематичною, якщо випадок, що не є повноцінним, має позитивну ймовірність.

Один з відповідних випадків, з якими я стикався, - це те, що в просторовому випадку люди можуть захотіти зменшити ранг частини з фіксованим ефектом за рахунок обчислювального врахування [Wikle].

Я не бачив жодної «науково цікавої» справи у такій ситуації, чи можете ви вказати на деяку літературу, де випадок, що не є повноцінним, викликає найбільше занепокоєння? Я хотів би дізнатися і обговорити далі, дякую.

Довідка

[Рао і Мітра] Рао, Кальямпаді Радхакришна та Суджіт Кумар Мітра. Узагальнена обернена матриця та її застосування. Вип. 7. Нью-Йорк: Вілі, 1971.

[Басу] Басу, Дебабрата. "Про усунення неприємних параметрів." Журнал Американської статистичної асоціації 72.358 (1977): 355-366.

[Хорн та Джонсон] Хорн, Роджер А. та Чарльз Р. Джонсон. Матричний аналіз. Кембриджська університетська преса, 2012.

[Wikle] Wikle, Крістофер К. "Представлення низького рангу для просторових процесів". Довідник просторової статистики (2010): 107-118.


Дякуємо за ваш інтерес та дуже продуману відповідь, +1 за зусилля. Я прочитаю його більш докладно і повернусь із деякими уточненнями. Я думаю, що перше, що мені доведеться уточнити, - це те, що в цій моделі немає випадкових ефектів, а матриця зовсім не є матрицею дизайну, за винятком, можливо, назви fr відсутності кращого слова; це дуже нелінійна функція (детермінована) параметра яка складається з (векторизації) коефіцієнта матриці в векторному авторегресивному процесі, тому концепція ймовірності бути низько-ранговою не має сенсу. Xα
еквалл

@ Student001 Так, не соромтеся робити будь-які роз’яснення, оскільки я також відчуваю це більше як GLM замість змішаної моделі. Спробую відповісти ще раз, якщо зможу :)
Генрі.L

@ Student001 Якщо ви можете, напишіть всю модель, і я хотів би вивчити такий випадок, можливо, AR (1) у просторовій обстановці, я думаю.
Генрі.L

"Враховуючи ймовірність такого способу мислення, ймовірність того, що не є повноцінним, дорівнює нулю." Правильна відповідь, неправильна проблема. Ймовірність того, що вона буде чисельно не повною, з обмеженою точністю, не дорівнює нулю. X(α)
Марк Л. Стоун

@ MarkL.Stone Я вже надав збурення як рішення, якщо уважно читати рядки, що є стандартним рішенням числової сингулярності. І ОП сказав, що оновить опис, тож, мабуть, ми досягнемо певного консенсусу щодо правильно сформульованої проблеми.
Генрі.L
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.