Коли використовувати дані Пуассона проти геометричних та негативних біноміальних GLM для даних підрахунку?


21

Я намагаюся розмістити для себе, коли доречно використовувати тип регресії (геометричний, пуассонський, негативний двочлен) з даними підрахунку, в рамках GLM (лише 3 з 8 розподілів GLM використовуються для підрахунку даних, хоча більшість з них Я читав центри навколо негативних біноміальних та пуассонових розподілів).

Коли використовувати дані Пуассона проти геометричних та негативних біноміальних GLM для даних підрахунку?


Поки я маю таку логіку: чи вважаються дані? Якщо так, то чи середня величина та відхилення неоднакові? Якщо так, негативна біноміальна регресія. Якщо ні, регресія Пуассона. Чи є нульова інфляція? Якщо так, нульовий завищений Пуассон або нульовий завищений від'ємний двочлен.

Запитання 1 Здається, не існує чіткої вказівки, що слід використовувати, коли. Чи є щось, щоб повідомити про це рішення? З того, що я розумію, щойно ви переходите на ZIP, середня дисперсія, рівна припущенню, стає розслабленою, тому вона знову схожа на NB.

Запитання 2 Де геометрична сім'я вписується в це чи які питання мені слід задавати дані, вирішуючи, чи використовувати геометричну сім'ю в моїй регресії?

Питання 3 Я бачу, що люди постійно змінюють негативні біноміальні та пуассонові розподіли, але не геометричні, тому я здогадуюсь, що є щось чітко інакше, коли його використовувати. Якщо так, то що це?

PS Я склав (напевне, спрощений, з коментарів) діаграму ( редаговану ) свого сучасного розуміння, якщо люди хотіли прокоментувати / налаштувати її для обговорення. Дані про підрахунок: Дерево рішень GLM


Я знайомий лише з програмуванням на R, але сподіваюся, що це допоможе ... stats.stackexchange.com/questions/60643/…
RYO ENG Lian Hu

@RYOENG, я це побачив і я виклав різницю, описану в моєму питанні, з логічним деревом. Мене особливо цікавить менш обговорюваний дистриб'ютор, а саме геометричний dist.
timothy.s.lau

(ОНОВЛЕННЯ) Відповідь @ Ніка Кокса тут: stats.stackexchange.com/questions/67547/when-to-use-gamma-glms, здається, капітулює настрої, які я бачив, поки що шукаю "Важко чітко визначити, коли використовувати його поза порожньою відповіддю кожного разу, коли це найкраще працює »
timothy.s.lau

@Glen_b гарний улов, я оновив логіку.
timothy.s.lau

Ви, мабуть, у безпеці видаляєте абзац про те, що ви також забарвлюєте модників.
Glen_b -Встановіть Моніку

Відповіді:


12

μ+1/θμ2μθα=1/θθ=θ=1

θ

Звичайно, є також безліч інших розподілів даних про одне чи багато параметрів (включаючи згаданий Вами Пуассон), який іноді може або не призведе до значно кращого пристосування.

Щодо зайвих нулів: Дві стандартні стратегії полягають у використанні нульового надутого розподілу даних підрахунку або моделі перешкод, що складається з двійкової моделі для нуля або більше плюс нульової усіченої моделі даних. Як ви згадуєте надлишкові нулі та наддисперсія, можуть збиватися з пантелику, але часто значне перевищення залишається навіть після коригування моделі на надлишки нулів. Знову ж таки, у випадку сумнівів, я б рекомендував використовувати нульову інфляційну модель чи модель перешкод за тією ж логікою, що і вище.

Відмова: Це дуже короткий і простий огляд. Застосовуючи моделі на практиці, я б рекомендував проконсультуватися з підручником з даної теми. Особисто мені подобаються книжки з підрахунками Вінкельмана та книги Cameron & Trivedi. Але є й інші хороші. Для обговорення на основі R вам також може сподобатися наш документ у JSS ( http://www.jstatsoft.org/v27/i08/ ).


4
мк+мк2>мк

3
мк

3
Як ви могли сказати з моїх попередніх коментарів: я не прихильник таких надмірних спрощених блок-схем. Для вибору хорошої моделі потрібно зрозуміти зв’язки між моделями та їх відношення до практичного застосування. Від того, чи може вас зацікавити геометрія чи ні, залежить від конкретного випадку застосування. Аналогічно, для нульової інфляції проти перешкод (які ви пропустили зі своєї діаграми). Нарешті, порядок питань не обов’язково однаковий для всіх програм тощо.
Ахім Цайле,

2
Я розумію, що мій ескіз здається трохи спрощеним. Але для студентів наук не рідкість починати з досить спрощених схем, якщо ви проходили уроки фізики, ви знайомі з тим, як часто вони змінюють і порушують "правила", які ви раніше вивчили, це є основою більш пізнього експертне та нюансове розуміння. Отже, заради навчання, я аспірант, я просто намагався отримати більш «правильне» розуміння основ, які я можу створити на більш пізніх, наприклад, перешкодах і т. Д. Дякую за посилання BTW, я вивчу підручники Ви згадали, як і ваш документ.
timothy.s.lau

1
Я думаю, що квазі-NB не додав би великої кількості квазі-Пуассону. У вас однакова середня функціяжурнал(мкi)=хiβ
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.