Яка максимальна оцінка правдоподібності коваріації біваріантних нормальних даних, коли середнє значення та дисперсія відомі?


11

Припустимо, у нас є випадкова вибірка з двовимірного нормального розподілу, який має нулі як засоби, а відхилення - тому єдиний невідомий параметр - коваріація. Що таке MLE коваріації? Я знаю, що це має бути щось на зразок але як ми це знаємо?1nj=1nxjyj


1
Як початківець, ви не вважаєте, що оцінити засоби за допомогою та трохи нечітко, коли насправді ми знаємо, що вони 0 і 0? x¯y¯
Вольфганг

Дуже дядько, виправив це. Тим не менш не бачиш, як це легко простежити. Це аналог дисперсії вибірки, але чому це MLE (якщо це не так, і я зробив ще одну помилку)
Стейсі

Ви видалили ? Прийняття цієї формули не означає, що ви вважаєте та як оцінки засобів. ˉ x ˉ y1ni=1n(xix¯)(yiy¯)x¯y¯
Стефан Лоран

@ StéphaneLaurent Так, у початковому дописі формула була подана так, як ви її написали.
Вольфганг

Відповіді:


12

Оцінювач коефіцієнта кореляції (який у випадку двовимірного стандарту дорівнює коваріації)

r~=1ni=1nxiyi

- це оцінювач «Метод моменту», коваріація вибірки. Давайте подивимось, чи збігається вона з максимальним оцінкою ймовірності, .ρ^

Спільна щільність стандартного двовимірного нормальна коефіцієнт кореляції İŞρ

f(x,y)=12π1ρ2exp{x2+y22ρxy2(1ρ2)}

і таким чином, імовірність ідентифікації зразка iid розміру єn

lnL=nln(2π)n2ln(1ρ2)12(1ρ2)i=1n(xi2+yi22ρxiyi)

(тут припущення про iid стосується кожного малюнка з двовимірної сукупності звичайно)

Прийняття похідної відносно та встановлення її дорівнює нулю дає поліном 3d ступеня у :ρρρ

ρ^:nρ^3(i=1nxiyi)ρ^2(11ni=1n(xi2+yi2))nρ^i=1nxiyi=0

Наскільки правильні обчислення можна перевірити, якщо взяти очікуване значення похідної, оцінене за справжнім коефіцієнтом rho-, воно буде рівне нулю.ρ

Для компактності, записи , який є сумою зразка дисперсії і . Якщо розділити вираз 1-го похідного на з'явиться оцінка MoM, конкретно(1/n)i=1n(xi2+yi2)=(1/n)S2XYn

ρ^:ρ^3r~ρ^2+[(1/n)S21]ρ^r~=0

ρ^(ρ^2r~ρ^+[(1/n)S21])=r~

Роблячи алгебру, не важко зробити висновок, що ми отримаємо якщо і тільки якщо , тобто лише в тому випадку, коли сума відхилень вибірки дорівнює сума істинних дисперсій. Так взагаліρ^=r~(1/n)S2=2

ρ^r~

То що ж тут відбувається? Хтось розумніший пояснить це, на даний момент спробуємо моделювання: я створив iid вибірку з двох стандартних нормалей з коефіцієнтом кореляції . Розмір вибірки становив . Значення вибірки булиρ=0.6n=1.000

i=1nxiyi=522.05,S2=1913.28

Оцінювач «Метод моменту» дає нам

r~=522.051000=0.522

Що відбувається з імовірністю журналу? Візуально ми маємо

введіть тут опис зображення

Числово ми маємо

ρ1st derivlnL0.570.92783.650.5159.41782.470.5247.7781.480.5335.78780.680.5423.64780.10.5511.29779.750.561.29779.640.5714.1779.810.5827.15780.270.5940.44781.050.653.98782.18

і ми бачимо, що ймовірність журналу має максимум tad до де також перша похідна стає нульовою . Жодних сюрпризів для значень не показано. Також у 1-ї похідної немає іншого кореня.ρ=0.56(ρ^=0.558985)ρ

Таким чином, це моделювання узгоджується з результатом того, що оцінка максимальної вірогідності не дорівнює методу оцінювання моментів (який є коваріацією вибірки між двома rv).

Але виявляється, що "всі" говорять, що це повинно ... тож хтось повинен придумати пояснення.

ОНОВЛЕННЯ

Посилання, що доводить, що MLE є оцінником методу моменту: Anderson, TW, & Olkin, I. (1985). Максимально вірогідна оцінка параметрів багатоваріантного нормального розподілу. Лінійна алгебра та її застосування, 70, 147-171.
Чи важливо, що тут всі засоби та відхилення можуть змінюватися та не фіксуватися?

... Мабуть, так, тому що коментар хлопця в іншій (тепер видаленій) відповіді говорить про те, що з заданими середніми та дисперсійними параметрами біваріантний нормальний стає членом зігнутої експоненціальної сім'ї (і тому деякі результати та властивості змінюються) ... що, здається, є єдиним способом узгодити два результати.


1
Це трохи дивно, але після деякого роздуму цього слід очікувати. Проблему можна переосмислити як оцінку коефіцієнта регресії в моделі де . Це не лінійна модель, тому немає підстав очікувати, що MLE буде простим точковим продуктом. Ця ж логіка показує (я думаю!), Що якщо ми знаємо лише тоді MLE є , а якщо ми знаємо лише . Якщо ми не знаємо жодного з них, ми отримуємо ваш оцінювач MOM. ρY=ρX+ϵϵN(0,1ρ22)Var(X)xy/xxxy/yyVar(Y)
хлопець

1
@guy: Дуже цікаво. Я вважаю, що ці аргументи, якщо їх трохи розширити, цілком заслуговують на те, щоб бути викладеними як окрема відповідь!
амеба

@guy Я не думаю, що ця формулювання є рівнозначною, тому що ймовірність журналу в створеній регресії містить квадрат . Коефіцієнт приєднаний до , відсутній у формулі біваріантної щільності. ϵ2=(yρx)2=y22ρxy+ρ2x2ρ2x2
Алекос Пападопулос

Моя здогадка - . Уявіть, що і , тоді очікується оцінка . 1ni=1n(xix¯)(yiy¯)n=2y1=y20
Стефан Лоран

1
@AlecosPapadopoulos . Термін скасовується знаменником , тому єдиним терміном з даних, що сприяє вашій початковій імовірності журналу, є . Але це також безпосередньо від відомої факторизації , . Інші мої твердження є помилковими, оскільки я нехтував включити до них термін . x2+y22ρxy=(1ρ2)x2+(yρx)2(1ρ2)x2(1ρ2)(yρx)2/(1ρ2)XN(μX,σX2)[Y|X]N(μY+ρXσYσX(XμX),σY|X21ρ22)σY/σX
хлопець

2

За заявлених умов ( і ) функція ймовірності для випадкової вибірки розміром дорівнюєμX=μY=0σX=σY=1n

L(ρ|X,Y)=1(2π[1ρ2])n/2exp[12(1ρ2)(XX2ρXY+YY)].

Тепер знайдіть імовірність журналу та візьміть похідну стосовно . Далі встановіть його рівним 0, вирішивши для . Звичайно, слід зробити відповідний тест, щоб показати, що ви виявили, що насправді є глобальним максимумом.ρρ^

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.