Максимальна оцінка вірогідності для усіченого розподілу


28

Розглянемо незалежних зразків отриманих із випадкової величини яка передбачається, що вона має усічений розподіл (наприклад, усічений нормальний розподіл ) відомих (кінцевих) мінімальних і максимальних значень і але невідомих параметрів та . Якби дотримувався нерізаного розподілу, максимальна оцінка ймовірності та для та із була б середньою вибіркоюNSXabμσ2Xμ^σ^2μσ2Sμ^=1NiSiі вибіркова дисперсія . Однак для усіченого розподілу визначена дисперсія вибірки, визначена таким чином, обмежена тому вона не завжди є послідовною оцінкою: для вона не може сходитись вірогідно до як переходить до нескінченності. Отже, здається, що та не є максимально вірогідними оцінками та для усіченого розподілу. Звичайно, цього можна очікувати, оскільки таσ^2=1Ni(Siμ^)2(ba)2σ2>(ba)2σ2Nμ^σ^2μσ2μσ2 Параметри усіченого нормального розподілу - не його середнє значення та дисперсія.

Отже, які максимальні ймовірності оцінок параметрів та усіченого розподілу відомих мінімальних та максимальних значень?μσ


Ви впевнені у своєму аналізі? Я думаю, ви робите неправдиве припущення: для усіченої ситуації MLE більше не є дисперсією вибірки (і, загалом, MLE вже не означає вибірку)! σ2μ
whuber

whuber: Я знаю, це саме моє запитання: що таке MLE з та в усіченому випадку? Додайте речення, щоб наполягати на цьому. σ2μ
a3nm

1
Не існує рішення закритої форми. Все, що ви можете зробити, це чисельно мінімізувати ймовірність журналу. Але це якісно не відрізняється від багатьох інших моделей, таких як логістична регресія, які також не мають рішення закритої форми.
whuber

whuber: Якщо це правда, це дуже невтішно. Чи є у вас посилання на відсутність рішень закритої форми? Чи є оцінювачі закритої форми, які не мають максимальної ймовірності, але є принаймні послідовними (і необов'язково об'єктивними?).
a3nm

1
@whuber: Чи можете ви принаймні спростити ваші вибірки до достатньої статистики, щоб мінімізація була швидкою?
Ніл Г

Відповіді:


29

Розглянемо будь -яку сім'ю масштабу локації, визначену "стандартним" розподілом ,F

ΩF={F(μ,σ):xF(xμσ)σ>0}.

Припускаючи, що відрізняється, ми легко знаходимо, що PDF-файли є .F1σf((xμ)/σ)dx

Обрізання цих дистрибутивів для обмеження їх підтримки між і , , означає, що PDF-файли замінюються наaba<b

f(μ,σ;a,b)(x)=f(xμσ)dxσC(μ,σ,a,b),axb

(і дорівнює нулю для всіх інших значень ), де є нормуючим фактором, необхідним для забезпечення інтеграції в одиницю. (Зверніть увагу, що однаково за відсутності усікання.) Імовірність журналу для iid даних отже, єxC(μ,σ,a,b)=F(μ,σ)(b)F(μ,σ)(a)f(μ,σ;a,b)C1xi

Λ(μ,σ)=i[logf(xiμσ)logσlogC(μ,σ,a,b)].

Критичні точки (включаючи будь-які глобальні мінімуми) знаходяться там, де або (особливий випадок я тут ігнорую), або градієнт зникає. Використовуючи підписники для позначення похідних, ми можемо формально обчислити градієнт і записати рівняння ймовірності якσ=0

0=Λμ=i[fμ(xiμσ)f(xiμσ)Cμ(μ,σ,a,b)C(μ,σ,a,b)]0=Λσ=i[fσ(xiμσ)σ2f(xiμσ)1σCσ(μ,σ,a,b)C(μ,σ,a,b)]

Оскільки і є фіксованими, їх із позначень і запишіть як і як . (Без відсікання обидві функції будуть однаково нульовими.) Відокремлення доданків, що містять дані, від решти даєabnCμ(μ,σ,a,b)/C(μ,σ,a,b)A(μ,σ)nCσ(μ,σ,a,b)/C(μ,σ,a,b)B(μ,σ)

A(μ,σ)=ifμ(xiμσ)f(xiμσ)σ2B(μ,σ)nσ=ifσ(xiμσ)f(xiμσ)

Порівнюючи їх із ситуацією без укорочення, видно, що

  • Будь-яка достатня статистика для вихідної проблеми є достатньою для усіченої проблеми (оскільки права частина не змінилася).

  • Наша здатність знаходити замкнуту форму рішення залежить від поступливості від і . Якщо вони не включають та простими способами, ми не можемо сподіватися отримати рішення закритої форми в цілому.ABμσ

У випадку звичайної сім'ї звичайно, задається накопичувальним нормальним PDF, що є різницею помилок: немає шансів, що рішення закритої форми може бути отримані загалом. Однак є лише дві достатні статистичні дані (середнє значення вибірки та дисперсія будуть), і CDF настільки ж гладкий, як це може бути, тому числові рішення отримати досить просто.C(μ,σ,a,b)


Велике спасибі за цю дуже детальну відповідь! Я не впевнений, що я розумію, що таке , , та , чи могли б ви їх визначити? Крім того, це очевидно, але якщо бути точним, можливо, ви можете сказати, що ваше вираження для pdf означає (а pdf - поза цим). Знову дякую! fμfσCμCσx[a,b]
a3nm

1
Звичайна довша позначення - тощо: як було оголошено, це похідна. Я зроблю другу запропоновану вами зміну, оскільки це важливе уточнення, дякую. Cμ=μC(μ,σ,a,b)
whuber

Крім того, оскільки ваша відповідь є загальнішою за ту, яку я очікував, я відредагував своє запитання, щоб менше наполягати на випадку звичайних розподілів. Ще раз дякую за ваші зусилля.
a3nm

1
На цьому рівні загальності було легше пояснити порівняно з фокусуванням на нормальних розподілах! Обчислення похідних та показ точної форми CDF - це непотрібні відволікання (хоча корисні, коли ви починаєте фактично кодувати числове рішення).
whuber

1
Дякуємо за виправлення! Ви пропустили одну з них; Ви можете переглянути мою редакцію?
a3nm
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.