Апроксимація для дискретного розподілу


11

Який найкращий спосіб наблизити для двох заданих цілих чисел коли ви знаєте середнє значення , дисперсію , косисть та надлишковий дискретного розподілу , і з (ненульових) мір фігури та що нормальне наближення не підходить?m , n μ σ 2 γ 1 γ 2 X γ 1 γ 2Pr[nXm]m,nμσ2γ1γ2Xγ1γ2

Зазвичай я б використав нормальне наближення з цілочисельною корекцією ...

Pr[(n½)X(m+½)]=Pr[(n½)μσZ(m+½)μσ]=Φ((m+½)μσ)Φ((n½)μσ)

... якби перекос і зайвий куртоз були (ближче до) 0, але це не так.

Я повинен виконати кілька наближень для різних дискретних розподілів з різними значеннями та . Тож мені цікаво дізнатися, чи існує встановлена ​​процедура, яка використовує та для вибору кращого наближення, ніж звичайне наближення.γ 2 γ 1 γ 2γ1γ2γ1γ2

Відповіді:


4

Це цікаве питання, яке насправді не має хорошого рішення. Існує кілька різних способів вирішити цю проблему.

  1. Припустимо основні моменти розподілу та відповідності - як запропоновано у відповідях @ivant та @onestop. Недоліком є ​​те, що багатоваріантне узагальнення може бути незрозумілим.

  2. Наближення сідлових точок. У цій статті:

    Gillespie, CS та Renshaw, E. Покращене наближення сідлових точок. Математичні біології , 2007.

    Ми дивимось на відновлення pdf / pmf, коли дано лише перші кілька моментів. Ми виявили, що такий підхід працює тоді, коли косоокість не надто велика.

  3. Розширення Лагер:

    Мустафа, Х. та Дімітракопулоса, Р. Узагальнено розширення Лагерра багатоваріантної щільності ймовірності з моментами . Комп'ютери та математика з додатками , 2010.

    Результати в цій роботі здаються більш перспективними, але я їх не кодував.


4

Пристосування розподілу до даних за допомогою перших чотирьох моментів саме те, що Карл Пірсон розробив сімейство Пірсонів для безперервного розподілу ймовірностей (максимальна ймовірність набагато популярніша в наші дні, звичайно). Потрібно просто підходити до відповідного члена цієї родини, тоді використовуйте той же тип корекції безперервності, який ви вказали вище для нормального розподілу.

Я припускаю, що ви повинні мати справді величезний розмір зразка? В іншому випадку вибіркові оцінки косості та особливо куртозу часто безнадійно неточні, а також є дуже чутливими до людей, що переживають людину. У будь-якому випадку, я настійно рекомендую поглянути на L-моменти як на альтернативу, які мають ряд переваг перед звичайними моментами, які можуть бути вигідний для пристосування розподілів до даних.


2

Ви можете спробувати використати звичайний косий розподіл і побачити, чи надлишок куртозу для ваших конкретних наборів даних є достатньо близьким до надмірного куртозу розподілу для заданої косості. Якщо це так, ви можете використовувати перекошений звичайний розподільний cdf для оцінки ймовірності. Якщо ні, то вам доведеться придумати перетворення на нормальний / скасований pdf, аналогічний тому, який використовується для нормального розповсюдження перекосу, що дасть вам змогу контролювати як перекос, так і надлишковий куртоз.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.