Негативний біноміальний розподіл проти біноміального розподілу


22

Яка різниця між негативним біноміальним розподілом і біноміальним розподілом?

Я спробував читати в Інтернеті, і виявив, що негативний біноміальний розподіл використовується, коли точки даних дискретні, але я думаю, що навіть біноміальний розподіл можна використовувати для дискретних точок даних.


5
Вони обидва дискретні.
Glen_b -Встановіть Моніку

5
Проста ілюстрація: Ви продаєте цукерки від дверей до дверей. У кожній двері, в яку ви стукаєте, у вас є ймовірність 1/4 продажу 1 цукерки та ймовірність 3/4 або продаж 0 батончиків. Ваша ймовірність продажу n барів, якщо ви постукаєте в 50 дверей, є двочленним розподілом в n. Ваша ймовірність того, що вам доведеться постукати у м двері, щоб продати 30 барів, є негативним біноміальним розподілом у м. Зауважте, що перший зрізається на 50, тому що ви не можете продати більше 50 барів, тоді як останній має хвіст в нескінченності, тому що ви могли просто мати жахливу удачу в той день і ніколи не продати 30-й бар.
Джеррі Ґерн

Відповіді:


30

Різниця полягає в тому, що нас цікавить. Обидва розподіли будуються з незалежних випробувань Бернуллі з фіксованою ймовірністю успіху, стор .

При біноміальному розподілі випадкова величина X - це кількість успіхів, спостеріганих у n випробуваннях. Оскільки існує фіксована кількість випробувань, можливі значення X дорівнюють 0, 1, ..., n .

При негативному біноміальному розподілі випадкова величина Y - кількість випробувань, поки не спостерігається r- й успіх. У цьому випадку ми продовжуємо збільшувати кількість випробувань, поки не досягнемо r успіхів. Можливі значення Y - r , r + 1 , r + 2 , ... без верхньої межі. Від'ємний біноміальний також може бути визначена в термінах числа невдач , поки г - го успіху, замість числа випробувань , поки г - го успіху. Вікіпедія визначає негативний біноміальний розподіл таким чином.

Отже, підсумовуючи:

Двомісні :

  • Фіксована кількість випробувань ( n )
  • Фіксована ймовірність успіху ( p )
  • Випадкова величина - X = Кількість успіхів.
  • Можливі значення 0 ≤ Xn

Негативний двочлен :

  • Фіксована кількість успіхів ( r )
  • Фіксована ймовірність успіху ( p )
  • Мінлива Random не є Y = число випробувань до г - го успіху.
  • Можливі значення - rY

Дякую Бен Болкер, що нагадав мені згадати підтримку двох дистрибутивів. Він відповів на відповідне запитання тут .


4
більш обговорення NB тут: stats.stackexchange.com/questions/6728 / ... . Можливо, варто відзначити, що біноміальна відповідь обмежена [0, N], відповіді NB не обмежені [0, ...]
Бен Болкер

Добре, я оновив свою відповідь, щоб включити цю.
Jelsema

дякую Jelsema за детальну відповідь, я міг би зрозуміти це краще зараз
само

19

Негативний біноміальний розподіл, незважаючи на очевидне відношення до біноміального, насправді кращий порівняно з розподілом Пуассона. Усі три дискретні, btw.

У практичному застосуванні NB є альтернативою Пуассону, коли ви спостерігаєте дисперсію (дисперсію) вищу, ніж очікував Пуассон. Пуассон - це перший вибір, який слід враховувати, коли ви маєте справу з даними про підрахунок, наприклад, щорічна кількість загиблих у ДТП у маленькому місті. Середнє значення та дисперсія Пуассона визначаються одним параметром - швидкістю появи, зазвичай позначається як . Поки ви оцінювали , ваша середня та відхилення дотримуються. Насправді середнє значення має дорівнювати дисперсії.λλ

Якщо ваші дані говорять про те, що дисперсія більша за середню (наддисперсія), це виключає Пуассона, то наступний розподіл, який слід розглядати, буде негативним двочленним. Він має більше одного параметра, тому його дисперсія може бути більшою за середню.

Взаємозв'язок NB до біномальних походить від основного процесу, як це було описано у відповіді @ Jelsema. Процес пов'язаний, тому розподіли теж є, але, як я пояснив тут, посилання на розповсюдження Пуассона є більш тісним у практичних додатках.

ОНОВЛЕННЯ: Іншим аспектом є параметризація. Біноміальне розподіл має два параметри: p і n. Його добросовісний домен - від 0 до n. У тому, що це не тільки дискретно, але й визначено на скінченному наборі чисел.

На противагу їм і Пуассон, і NB визначаються на нескінченному наборі невід’ємних цілих чисел. У Пуассона є один параметр , а в NB два: p і r. Зауважте, що у цих двох немає параметра . Таким чином, це ще один спосіб побачити, як пов’язані NB та Пуассон.λн


3
Я не розумію, що ви маєте на увазі під «кращим порівняно з розподілом Пуассона». Оригінальне запитання не говорить про те, який тип моделювання бажаний. Це навіть не означає, що хтось взагалі зацікавлений у моделюванні.
heropup

@heropup, OP очевидно зацікавлений у додатках і безпосередньо порівнює NB з Binomial. Отже, моя відповідь стосується цього порівняння, і це порівняння з Пуассоном є більш доречним у типових програмах.
Аксакал

7

Вони обидва дискретні і відображають кількість під час відбору проб.

DNS=(DDD,DDN,DND,DNN,NDD,NDN,NND,NNN)

S=(D,ND,NND,NNND,...)

p

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.