Використання пуассонової регресії для безперервних даних?


11

Чи можна розподіл пуассона використовувати для аналізу безперервних даних, а також дискретних даних?

У мене є кілька наборів даних, де змінні відповіді є безперервними, але більше нагадують розподіл Пуассона, а не звичайне. Однак розподіл пуассона є дискретним розподілом і зазвичай стосується чисел чи підрахунків.


Чим ваші емпіричні розподіли відрізняються від змінних Gamma?
whuber

1
Я використовував розподіл гамми для цих даних. Якщо ви використовуєте гамма-розподіл із посиланням на журнал, ви отримуєте майже такий самий результат, який отримуєте від надмірно дисперсної моделі пуассона. Однак у більшості статистичних пакетів я знайомий з пуассоновою регресією простіший та гнучкіший.
користувач3136

Чи не було б інших дистрибуцій, які кращі, наприклад, пропозиція Гамера про гамму?
Пітер Флом

1
@PeterFlom - Цікаво, чи виникає ця проблема багато, оскільки пакет glmnet в R не підтримує ні сімейство Gamma, ні сім'ю Гаусса з функцією зв’язку журналу. Однак, тому що glmnet використовується як пакет прогнозування моделювання (отже, користувачів цікавлять лише коефіцієнти моделі, а не коефіцієнт. Stnd помилки) і оскільки Poisson dbn створює послідовний коефіцієнт. Оцінки для моделей форми ln [E (y)] = beta0 + beta * X з безперервними відповідями незалежно від розподілу, я здогадуюсь, автори glmnet не заважали включати ці додаткові сімейства.
RobertF

Відповіді:


12

Ключовим припущенням узагальненої лінійної моделі, що є актуальним тут, є співвідношення між дисперсією та середнім рівнем реакції, враховуючи значення предикторів. Коли ви вказуєте розподіл Пуассона, це означає, що ви припускаєте, що умовна дисперсія дорівнює умовному середньому. * Фактична форма розподілу не має великого значення: це може бути Пуассон, або гама, або нормальна, або будь-що інше, наскільки це стосується середньої дисперсії.

* Ви можете розслабити припущення, що дисперсія дорівнює середній величині пропорційності, і все ж зазвичай отримують хороші результати.


9

Якщо ви говорите про використання реакції Пуассона в узагальненій лінійній моделі, то так, якщо ви готові зробити припущення, що дисперсія кожного спостереження дорівнює його середній.

Якщо ви не хочете цього робити, іншою альтернативою може бути перетворення відповіді (наприклад, прийняти журнали).


Я думаю, на додаток до вашої точки зору, навіть якщо @ user3136 не бажає робити припущення про середню = дисперсію, він може використовувати quasipoissonсім'ю в glm.
suncoolsu

2
Але моя проблема полягає в тому, чому ви хочете перетворити нескінченні дані в дискретні. Це істотно втрачає інформацію. Крім того, коли проста logтрансформація спрацювала, навіщо дискретизувати свої дані? Використовуючи glmтвори, але кожен результат базується на асимптотиці (яка може бути, а може і не бути)
suncoolsu

@suncoolsu: 1) квазіпоассон робить припущення про середнє значення пропорційним дисперсії. 2) Я не мав на увазі перетворення на дискретний, я мав на увазі перетворення (збереження безперервності), щоб ви могли використовувати іншу модель.
Simon Byrne

так - я зрозумів, що згоден з вами. Вибачте, я говорив про запитання. Квазі-пуассон, враховує наддисперсній право? (якщо я добре пам’ятаю, пор. Faraway 2006)
suncoolsu

У цьому конкретному випадку я не був задоволений, що будь-яке перетворення, яке я намагався (log, sqrt, box-cox), дало хороше наближення до нормальності. Між іншим, якщо я використовую звичайний метод перетворення балів, то я можу перетворити більшість даних майже на прекрасну нормальність, але я не бачив, щоб ця трансформація широко використовувалася, тому я припускаю, що є улов (важко повернути назад).
користувач3136
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.