Просте наближення кумулятивного розподілу Пуассона в довгий хвіст?


10

Я хочу визначити ємність С таблиці, щоб вона мала залишкові шанси менше для переповнення для заданого , припускаючи, що кількість записів відповідає закону Пуассона із заданим тривалість . p [ 40 120 ] E [ 10 310 12 ]2-pp[40120]Е[1031012]

В ідеалі я хочу, щоб найнижче ціле число було Cтаким, що 1-CDF[PoissonDistribution[E],C] < 2^-pдля заданих pі E; але я задоволений деякими Cдещо вищими за це. Mathematica прекрасно підходить для ручного обчислення, але я хотів би обчислити Cз pі Eпід час компіляції, що обмежує мене в 64-бітному цілочисельний арифметики.

Оновлення: у Mathematica (версія 7) e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]є 1231і, здається, правильно (спасибі @Procrastinator); однак результат і для того p = 50і p = 60є 1250, що неправильно з боку небезпеки (і важливо: мій експеримент повторюється як разів і більше, і я хочу, мабуть, менше ніж шансів на невдачу). Я хочу певного, але безпечного наближення, використовуючи лише 64-бітну цілу арифметику , як це доступно в C (++) під час компіляції. 2 - 302252-30


1
Як щодо C = Quantile[PoissonDistribution[E],1-2^p]?

1
Провідний член функції ймовірнісних мас Пуассона домінує в хвості.
кардинал

1
@Procrastinator: так , що працює в Mathematica (за винятком знака p, а також питання точності, і імена Eі Cякі зарезервовані). Але мені потрібно просте наближення цього, можливо, сирого (але з безпечної сторони), використовуючи лише 64-бітну цілу арифметику!
fgrieu

3
Повторіть оновлення: Mathematica 8 повертає 1262 для і 1290 для p = 60 . Повторне наближення (@Proc): не можна очікувати, що воно буде добре працювати в хвостах, що є ключовим для розрахунку. p=50p=60
whuber

1
Можливо, вам слід запитати про stackoverflow. Я не знайомий з вашими обмеженнями. Я не знаю, що заважає вам використовувати динамічне розподілення пам’яті, чи ви можете використовувати розгалуження, щоб визначити розмір масиву, або які витрати на визначення масиву, що вдвічі перевищує потрібний вам розмір (а потім не використовувати всі з неї). Якщо деякі функціонують як (лише як приклад) дав точну відповідь, чи зможете ви здійснити наближення під вашими обмеженнями чи ні? Наче зараз проблема програмування. μ+loglogμlogμμ+pμlogмк
Дуглас Заре

Відповіді:


10

Розподіл Пуассона з великим середнім значенням є приблизно нормальним, але ви повинні бути обережними, що вам потрібно зав'язати хвіст, а нормальне наближення пропорційно менш точне біля хвостів.

Один із підходів, що використовується в цьому запитанні про МО та при біноміальних розподілах, полягає у визнанні того, що хвіст зменшується швидше, ніж геометричний ряд, тому ви можете записати явну верхню межу як геометричний ряд.

к=Dдосвід(-мк)мккк!<к=Dдосвід(-мк)мкDD!(мкD+1)к-D=досвід(-мк)мкDD!11-мкD+1<досвід(-мк)мкD2πD(D/е)D11-мкD+1=досвід(D-мк)(мкD)DD+12πD(D+1-мк)

Рядок 2 рядок 3 стосувався формули Стірлінга. На практиці я думаю, ви тоді хочете вирішити - p log 2 = log ( прив'язаний ) чисельно за допомогою двійкового пошуку. Метод Ньютона, починаючи з початкової здогадки D = μ + c -pжурнал2=журнал(пов'язаний)також повинні працювати.D=мк+cмк.

Наприклад, при і μ = 1000 , числове рішення, яке я отримую, становить 1384,89. Розподіл Пуассона із середнім значенням 1000p=100мк=10001000 приймає значення від через 1384 з ймовірністю 1 - +1 / +2 100.06 . Значення 0 через 1383 відбувається з імовірністю 1 - 1 / 2 99.59 .01384 рік1-1/2100.06.01383 рік1-1/299,59.


1
+1. Інший підхід пов'язує ймовірності хвоста Пуассона (праворуч) з хвостовими ймовірностями розподілу гамми (зліва), які можна уважно (над) оцінити з наближенням сідлоподібної точки.
whuber

Існує довгий шлях від цього до чогось, обмеженого 64-бітною цілочисельною арифметикою (без досвіду, журналу, sqrt ..), але я буду працювати над цим; Дякую всім!
fgrieu

(+1) До виклику наближення Стірлінга (що не має значення), це саме та межа, про яку я (непрозоро) посилався у своєму коментарі до ОП. (Наприклад, дивіться тут .)
кардинал

2

Ви можете побачити P. Harremoës: Різкі межі на ймовірності хвоста для випадкових змінних Пуассона https://helda.helsinki.fi/bitstream/handle/10138/229679/witmse_proc_17.pdf Основні нерівності полягають у наступному. Нехай Y - випадкова величина Пуассона з параметром λ . Покладіть

Г(х)=2(хlnхλ+λ-х)  сiгн(х-λ).
НехайΦпозначає функцію кумулятивного розподілу для стандартного нормального закону. Тоді для всіх цілихк0,
П(Y<к)Φ(Г(к))П(Yк),
що еквівалентно Φ ( G ( k -1))P(Y<k)Φ(G(k)) для всіх цілих чиселk>0
Φ(Г(к-1))П(Y<к)Φ(Г(к))
к>0 . Крім того, Φ(Г(к+(1/2)))П(Yк) , яке означає , що
Φ(Г(к-1/2))П(Y<к)Φ(Г(к))
для всіх цілих чиселк>0 .


Якби ви могли написати основне рівняння (якщо припустити, що є лише одне-два), яке допоможе у випадку, якщо посилання на деякий час перестане вмирати.
jbowman
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.