Приклади процесів, які не є Пуассоном?


15

Я шукаю кілька хороших прикладів ситуацій, які не підходять для моделювання з розподілом Пуассона, щоб допомогти мені пояснити розподіл Пуассона студентам.

Як правило, можна використовувати кількість клієнтів, які приходять до магазину за часовий проміжок, як приклад, який можна змоделювати за допомогою дистрибуції Пуассона. Я шукаю контрприклад у подібному ключі, тобто ситуацію, яку можна розглядати як процес позитивного підрахунку протягом постійного часу, який явно не є Пуассоном.

В ідеалі ситуація повинна бути максимально простою та зрозумілою, щоб студентам було легко зрозуміти та запам'ятати.


5
Це питання надзвичайно широке. Якщо область звуження не звужується і не додається ще якийсь контекст, дуже ймовірно, що в кінцевому підсумку це буде закритим. Без сенсу звучати зайво різко, це схоже на запитання: "Які є приклади квітів, які не червоні?" (Кью Гаррі Чапін.)
кардинал

1
Точка взята. Мої вибачення. Я мав би зробити це більш конкретним. Я відредагував це, щоб спробувати зробити його більш зрозумілим.
Нагель

1
(+1) до питання та коментаря. Оновлення набагато краще. :-)
кардинал

2
Я припускаю, що ви маєте на увазі "задані процеси, за які люди можуть хоча б наївно вважати Пуассона" (наприклад, принаймні, процес підрахунку). Поширений приклад - кількість претензій на загальні страхові поліси (страхування та відшкодування), обумовлена ​​низкою можливих факторів, що найбільш очевидно відображається на неоднорідності ставок вимог - тому існує суперпозиція процесів Пуассона з різною інтенсивністю. У ситуаціях, коли розподіл ставок вимог добре апроксимується гамма-розподілом, розподіл кількості позовів у свою чергу апроксимується негативним двочленом.
Glen_b -Встановіть Моніку

Відповіді:


5

Кількість викурених сигарет за певний проміжок часу: для цього потрібен процес із завищенням нуля (наприклад, Пуассон із нулем або негативний двоманійний надутий), оскільки не всі курять цигарки.


Спасибі! Багато тут згадували нульові процеси, але я вважаю, що це найпростіший і наочний приклад: кількість цигарок, викурених випадково вибраною людиною за певний проміжок часу.
Нагель

Можливо, існує суперечка з аргументом "не всі курять сигарети", хоча, ви можете стверджувати, що цей процес все ще є Пуассоном, лише що параметр інтенсивності є специфічним для кожної людини і невідомим (некурящі мали б дуже мало інтенсивність) - правда? Однак можна також стверджувати, що ця ситуація порушує припущення Пуассона в тому, що викурені сигарети, як правило, розподіляються рівномірно протягом дня (для звичайних курців) або грона (для соціальних курців), так що непересічні часові інтервали не є незалежними. Тож це все ще хороший приклад, я думаю.
Нагель

1
Кількість виловленої риби за певний проміжок часу є, я думаю, більш канонічним прикладом для ZIP та ZINB. Подібні аргументи. Нехай риба не має адекватного впливу на швидкість споживання. (Я знаю, я знаю, для риб вашої мами , за винятком, тому що вони що добре :).
Олексій

8

Ви маєте на увазі позитивні дані підрахунку? Без обмежень?

Популярний негативний двочлен.

Ще однією хорошою моделлю є Пуассон із завищеною 0. Ця модель передбачає, що або щось відбувається, або його немає - і якщо воно є, то воно слідує за Пуассоном. Я недавно бачив приклад. Медсестер, які лікували хворих на СНІД, запитували, як часто вони відчувають стигматизуючу поведінку у інших внаслідок своєї участі у хворих на СНІД. Велика кількість ніколи не мала такого досвіду, можливо, через те, де вони працювали чи жили. Серед тих, хто це зробив, кількість стигматизуючих переживань варіювалась. Повідомлялося більше 0, ніж можна було очікувати від прямого Пуассона, в основному тому, що певна частка досліджуваної групи просто не знаходилася в оточенні, яке піддало їх такій поведінці.

Суміш Пуассона також дасть точковий процес.


(+1) для нульового надутого розподілу Пуассона. Дискусію щодо цієї моделі можна знайти тут

1
+1 до цього (та інших відповідей), які надають фактичні приклади ситуацій, про які йдеться у питанні, а не просто абстрактні розподіли. Цей приклад ZIP особливо виразний.
whuber

1
На честь тих, хто відповів, я повинен зазначити, що моє запитання спочатку було занадто неохайним і взагалі не стосувалося ситуацій. Я згоден, що нульовий надутий Пуассон - хороший приклад. Однак мені здається, що це занадто задіяно, щоб пояснити студентам з нижчими класами, тому я все ще пропускаю приклади простих ситуацій, які неможливо змоделювати за допомогою розподілу Пуассона.
Нагель

4

Підрахунок процесів, які не є Пуассоном? Ну, будь-який процес кінцевого простору зразка, наприклад, двочленний або дискретний рівномірний. Ви отримуєте процес підрахунку Пуассона від підрахунку подій, що мають незалежні часи взаємозв'язку, які розподілені експоненціально, тому випадає ціла низка узагальнень, таких як гамма або логіка, або Вейбулл, що поширюються міжмісцевими часом, або будь-який абстрактний непараметричний час взаємозв'язку. розповсюдження.


Дякую за вашу відповідь, і мені дуже шкода, що моє запитання спочатку було таким незрозумілим. Я зараз це уточнив. Що ви говорите про процеси з неекспоненціальним та / або залежним часом взаємозв'язку має сенс, але чи є у вас приклади ситуацій, які матимуть ці властивості, чим простіше, тим краще?
Нагель

4
Будьте впевнені! Час між спалахами вірусу герпесу. У вас є набагато довший час до вашої початкової спалахи, оскільки ви дійсно повинні заразитися вірусом. Ваші часи взаємодії між спалахами після цього не залежать один від одного, але йдуть набагато швидше, ніж показник спалаху індексу. Норма неекспоненціальної взаємодії є нормою. В аналізі виживання, поширеним аналітичним методом є моделі пропорційних небезпек Кокса, де ви позбавитесь від будь-яких параметричних припущень про часи взаємодії.
AdamO

Гарний приклад! Я здогадуюсь, це ще один примірник завищеного нулем Пуассона, про який згадувала Плакідія вище?
Nagel

4

Незрозуміло, хочете ви рахувати процеси чи ні.

Якщо я інтерпретую тег «викладання», маючи на увазі, що ви навчаєте процесу Пуассона, тоді для навчання про процес в цілому, процес Бернуллі - це легкий випадковий процес для пояснення та візуалізації і пов'язаний з процесом Пуассона. Процес Бернуллі є дискретним аналогом, тому він може стати корисною компаньйоном. Справа лише в тому, що замість безперервного часу ми маємо дискретні інтервали часу.

Прикладом може бути людина, що продає двері до дверей, де ми рахуємо успіхи будинків, які роблять покупку.

  • Кількість успіхів у перших n випробуваннях має біноміальне
    розподіл B (n, p) замість Пуассона
  • Кількість випробувань, необхідних для досягнення успіху r, має негативний біноміальний розподіл NB (r, p) замість гамма-розподілу
  • Кількість випробувань, необхідних для досягнення одного успіху, час очікування, має геометричний розподіл NB (1, p), що є дискретним аналогом експоненції.

Ось такий підхід Берцекас і Цицикліс використовують у Введенні до ймовірності , 2-е видання, вводячи процес Бернуллі до процесу Пуассона. У їх підручнику є більше розширень на процес Бернуллі, застосовних до процесу Пуассона, таких як злиття їх або розділення їх, а також набори проблем з рішеннями.

Якщо ви шукаєте приклади випадкових процесів, і ви просто хочете викинути імена там, їх досить багато.

Процес Гаусса є важливим у застосуванні. Зокрема, процес Вайнера, який є типом Гауссового процесу, також називається стандартним броунівським рухом і має застосування у фінансах та фізиці.


Дякую за вашу відповідь, і мені дуже шкода, що моє запитання спочатку було настільки непростим і неясним. Я зараз намагався уточнити це. Посилання від Бернуллі до Пуассона є цікавою, але те, що я шукаю, - це приклади ситуацій у постійному часі, які не підходять для моделювання розподілом Пуассона, чим простіше, тим краще.
Нагель

3

Як актуарій власності / випадковості я маю справу з прикладами реального життя дискретних процесів, які весь час не є Пуассоном. Для високочастотних, низькочастотних ліній бізнесу розподіл Пуассона є невідповідним, оскільки він вимагає співвідношення відхилення до середнього значення 1. Від'ємний біноміальний розподіл, згаданий вище, набагато частіше використовується, а розподіли Делапорте використовується в деяких літературах, хоча рідше в стандартній північноамериканській актуарній практиці.

Чому це так, питання більш глибоке. Чи настільки кращий від'ємний двочлен, тому що він являє собою процес Пуассона, для якого середній параметр розподіляється гаммою? Або це тому, що випадки втрат втрачають незалежність (оскільки події землетрусу роблять в сучасній теорії, що чим довше чекає, коли земля сповзатиме, тим більше шансів, що це пов’язано з накопиченням тиску), це нестаціонарно (інтервали не можна підрозділяти на послідовності, кожна з яких є стаціонарними, що дозволило б використовувати неоднорідний Пуассон), і, безумовно, деякі напрямки бізнесу дозволяють одночасно виникати (наприклад, медичні помилки з кількома лікарями, на які поширюється політика).


2

Інші згадали кілька прикладів точкового процесу, які не є Пуассоном. Оскільки Пуассон відповідає експоненціальним міжприбутковим часом, якщо ви вибираєте будь-який міжособистісний розподіл часу, який не є експоненціальним, то в результаті точковий процес не є Пуассоном. АдамО вказав на Вейбула. Ви можете використовувати гамму, лонормальний або бета-версію як можливий вибір.

Пуассон має властивість, що його середнє значення дорівнює його дисперсії. Точковий процес, який має відхилення більше середнього, іноді називають наддисперсним, і якщо середнє значення більше дисперсії, воно є недисперсним. Ці терміни використовуються для відновлення процесу до Пуассона. Негативний двочлен часто використовується, оскільки може бути передисперсним або недодисперсним залежно від його параметрів.

Пуассон має постійну дисперсію. Точковий процес, який відповідає умовам Пуассона, за винятком того, що він не має параметра постійної швидкості, і, отже, середнє значення та дисперсія, що змінюються за часом, називається неоднорідним Пуассоном.

Процес з експоненціальним часом взаємозв'язку, але може мати кілька подій на час прибуття, називається складним Пуассоном. Хоча подібний до процесу Пуассона і має назву зі словом Пуассон в ньому, неоднорідні та складні процеси Пуассона відрізняються від процесу Пуассона.


Дякую за вашу відповідь, і мені дуже шкода, що моє запитання спочатку було таким непристосованим і незрозумілим. Я зараз намагався уточнити це. Ви згадуєте процеси з неекспоненціальним та / або залежним часом взаємозв'язку, і те, що ви говорите про надмірні та недисперсні розподіли, дуже цікаво, але чи є у вас приклади конкретних ситуацій, які матимуть ці властивості? Чим простіше, тим краще :)
Nagel

1
Замість того, щоб спробувати дати власну відповідь, я думаю, що насправді існує багато-багато прикладів, які ви можете знайти в книгах, які стосуються процесів підрахунку. Дозвольте порекомендувати переглянути книгу Джо Хільбе про негативну біноміальну регресію .
Майкл Р. Черник

2

Ще один цікавий приклад процесу підрахунку Поассона представлений нульовим розподілом Пуассона (ZTPD). ZTPD може вміщувати дані щодо кількості мов, які суб'єкти можуть говорити у фізіологічних умовах. У цьому випадку розповсюдження Пуассона погано поводиться, оскільки кількість розмовних мов за визначенням> = 1: отже, 0 виключається апріорі.


2

Я вважаю, що ви можете скористатися процесом Пуассона з приїздом клієнтів і налаштувати його двома різними способами: 1) кількість відвідувачів вимірюється цілодобово, але магазин фактично не працює цілий день; Пуассон обробляє часи прибуття клієнтів і дивіться різницю між приїздом у два магазини. (Приклад №2 - з мого розуміння Посібника Спрингера з інженерної статистики, частина A Властивість 1.4.)


1

Можливо, ви хочете переглянути футбольний приклад. Складається враження, що коефіцієнт підрахунку балів для обох команд збільшується по мірі продовження матчу, і що вони змінюються, коли команди змінюють свої атакуючі / захисні пріоритети у відповідь на поточний рахунок.

А точніше, скористайтеся ним як приклад того, як прості моделі можуть напрочуд добре працювати, стимулюючи інтерес до статистичного дослідження певного явища та надаючи орієнтир для майбутніх досліджень, які збирають більше даних для дослідження розбіжностей та пропонують розробки.

Dixon & Robinson (1998), "Модель процесу народження для футбольних матчів асоціацій", Статист , 47 , 3.


У мене була думка, що футбольні матчі були не зовсім Пуассоном, але спасибі за довідку :)
Nagel,

1

Оскільки питання пов'язане з тим, щоб зробити розподіл Пуассона більш зрозумілим, я підкажу це, оскільки нещодавно я розглядав цю схему вхідних викликів дещо для цього центру (де слідує час пам'яті без експонентного розподілу).

Я думаю, що заглиблюватися в іншу тангенціальну модель, яка по суті вимагає знань Пуассона, щоб зрозуміти, як це не одна, може бути дещо заплутаною, але це тільки я.

Я думаю, що проблема з розумінням Пуассона полягає в безперервній осі часу, на якій вона знаходиться --- як щосекундна триває, подія більше не відбудеться --- але чим далі в майбутньому ви йдете, тим впевненіше відбувається.

Дійсно, я думаю, що це спрощує розуміння, якщо ви просто торкаєте вісь "час" для "випробувань" або "подій".

Хтось може мене виправити, якщо це далеко від бази, тому що я вважаю, що це просте пояснення, але я думаю, що ви можете замінити фліп монети або викидання кістки на "час, поки не надійде телефонний дзвінок" (що я зазвичай використовують для персоналу Erlang C / кол-центр).

Замість "часу, поки не надійдуть телефонні дзвінки" ----, ви можете замінити його на ... "котиться, поки кістка не потрапить на шість".

Це випливає з тієї ж загальної логіки. Ймовірність (як і будь-яка гра в азартні ігри) є абсолютно незалежною від кожного ролика (або хвилини) і не має пам'яті. Однак вірогідність "немає 6" зменшується все повільніше, але точно до 0, оскільки ви збільшуєте кількість випробувань. Це простіше, якщо ви бачите обидва графіки (ймовірність дзвінка з часом, проти ймовірності шести з рулонами).

Я не знаю, чи це має сенс --- саме це допомогло мені скласти це в конкретні терміни. Тепер розподіл пуассона - це кількість, а не "час між дзвінками" або "випробування, поки не з'явиться шість", але вона покладається на цю ймовірність.


Я бачу, як ви могли б подумати, що це може бентежити студентів, але моя ідея полягала в тому, що мені було б легше пояснити, чому кількість клієнтів, які приїжджають до ресторану за часовий проміжок, - це Пуассон, якщо у мене лічильник -приклад простого процесу з дискретними подіями в безперервному часі, який не був Пуассоном.
Нагель

1
Є багато варіантів, я думаю. Однією очевидною закономірністю були події, які збільшують або зменшують ймовірність із власними подіями. Важко придумати деякі приклади. Можливо, мурахи, що прибувають на вашу кухню / пікнік. Час, який потрібен для прибуття першого мураха, ймовірно, набагато довший, ніж другий чи третій, і, звичайно, більше приліт мурашок означає більш ймовірні майбутні прибуття мурашок (враховуючи, що їх стежки / спілкування один з одним). Не впевнений, чи порахували б це.
Джон Бабсон

1

Кількість відвідувань окремим клієнтом продуктового магазину протягом заданого часового проміжку.

Після того, як ви завітали до продуктового магазину, ви навряд чи повернетесь на деякий час, якщо не помилитесь із плануванням.

Я думаю, що тут можна використовувати негативний біноміальний розподіл, але він дискретний, тоді як відвідування тривають постійно.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.