Вимірювання корисності придатності в моделі, що поєднує два розподіли


9

У мене є дані з подвійним піком, які я намагаюся моделювати, і між вершинами достатньо перекриття, що я не можу їх самостійно лікувати. Гістограма даних може виглядати приблизно так:

alt текст

Для цього я створив дві моделі: одна використовує два розподіли Пуассона, а друга використовує два негативних біноміальних розподілу (для обліку наддисперсії). Який підходящий спосіб визначити, яка модель точніше відповідає даних?

Моя початкова думка полягає в тому, що я міг би використати тест Колмогорова-Смірнова для порівняння кожної моделі з даними, а потім зробити тест на коефіцієнт ймовірності, щоб перевірити, чи є одна з них значно кращою. Це має сенс? Якщо так, я не точно впевнений, як виконати тест на коефіцієнт ймовірності. Чи підходить чі-квадрат, і скільки я маю свободи?

Якщо це допомагає, деякий (дуже спрощений) код R для моделей може виглядати приблизно так:

## inital data points
a <- read.table("data")

#create model data
model.pois = c(rpois(1000000,200),rpois(500000,250))
model.nb = c(rnbinom(1000000,200,0.5),rnbinom(500000,275,0.5)

#Kolmogorov-Smirnov test
#use ks.boot, since it's count data that may contain duplicate values
kpois = ks.boot(model.pois,a)
knb = ks.boot(model.nb,a)

#here's where I'd do some sort of likelihood ratio test
# . . .

Редагувати: Ось зображення, яке може пояснити дані та розподіли, які мені краще підходять. З візуалізації абсолютно зрозуміло, що друга модель (використовуючи негативне біноміальне відхилення для обліку наддисперсії) є кращим підходом. Я хотів би показати це кількісно. alt текст

(червоний - дані, зелений - модель)


чи знаєте ви розподіл ймовірності значень у кожному смітнику ? Мітка осі y змушує мене думати, що це може бути пуассонівська або багаточленна? (якщо припустити, що модель дає середнє значення у кожній кошику)
Андре Хольцнер,

Дані по суті складаються з двох процесів Пуассона, але є приховані змінні, які я не можу виправити, що призводить до наддисперсії. Таким чином, негативний двочлен, безумовно, є кращою моделлю. (див. нове зображення / текст, який я додав вище). Мені потрібно показати, що моя модель nb краще підходить кількісно.
chrisamiller

1
Як щодо такої метрики, як Помилка середнього квадрата між фактичними та передбачуваними значеннями?

hrmm - мені подобається ця ідея, Сріканте. Це набагато простіше, ніж я думав, але все ж має сенс. Напишіть відповідь нижче, щоб я міг зарахувати її та надіслати деякий представник вашого шляху. Мені все ще цікаво почути інші методи, але це може працювати зараз.
chrisamiller

Відповіді:


4

Для порівняння двох моделей можна використовувати такий показник, як середня квадратична помилка між фактичними та передбачуваними значеннями.


1
Це була правильна відповідь для моєї конкретної ситуації, навіть якщо відповідь Glen_b допомогла мені дізнатися більше. Тож більше прихильників для нього, прийнятих відповідь за Сріканта. Усі перемагають - дякую всім.
chrisamiller

8

Ви не можете їх порівняти безпосередньо, оскільки у негативного бінома є більше параметрів. Дійсно, Пуассон "вкладений" в негативний біном, в тому сенсі, що це обмежувальний випадок, тому NegBin завжди підходить краще, ніж Пуассон. Однак це дозволяє розглянути щось на кшталт тесту на коефіцієнт ймовірності, але той факт, що Пуассон знаходиться на межі простору параметрів для негативного бінома, може вплинути на розподіл тестової статистики.

У будь-якому випадку, навіть якщо різниця в кількості параметрів не була проблемою, ви не можете робити тести KS безпосередньо, тому що у вас є оцінені параметри, а KS спеціально для випадку, коли вказані всі параметри. Ваша ідея використання завантажувальної програми займається цим питанням, але не першим (різниця в кількості параметрів)

Я б також розглядав плавні випробування на придатність (наприклад, див. Книгу Рейнера та Беста), які, наприклад, можуть призвести до розділення тесту на користь чі-квадрата на відповідні компоненти (вимірювання відхилень від моделі Пуассона у цьому випадку) - якщо взяти участь у четвертому чи шостому порядку, це повинно призвести до випробування з хорошою потужністю для альтернативи NegBin.

(Редагувати: Ви можете порівняти пристосування пуассона та негбіну за допомогою тесту чи-квадрата, але він буде мати низьку потужність. Розбиття чі-квадрата і, дивлячись лише на вимову перших 4-6 компонентів, як це робиться з плавними тестами, може зробити краще .)


Дякую. Це пояснює купу речей і відкриває цілу низку нових питань, над якими мені доведеться провести деякі дослідження. Я думаю, моє головне питання полягає в тому, чи означає те, що ви говорите, що щось більш просте, як-от уникнути помилки середнього квадрату в квадраті, не є коректним способом підходу до цієї проблеми? Я визнаю, що це, мабуть, не так надійно і не дасть мені значення p, але я можу швидко зробити це, намагаючись відшукати копію книги, на яку ви посилаєтесь. Будь-які думки були б вдячні.
chrisamiller

2
уявіть, що у вас був набір точок (x, y), і ви розглядали, чи може ви підходити пряма чи квадратична. Якщо ви порівнювали RMSE, квадратик завжди бив пряму , тому що лінія є квадратичною з одним параметром, встановленим нулем: якщо оцінка параметру найменшого квадрата становить рівно нуль (що має нульову ймовірність для безперервної відповіді), це краватку, і в будь-якому іншому випадку лінія програє. Так само і з Пуассоном проти негативного двочлена - вільний Негативний біном завжди може вміщуватися як мінімум так само, як і вільний Пуассон.
Glen_b -Встановіть Моніку

Гарне пояснення - я розумію, що ти зараз кажеш. Я думаю, що мій випадок дещо інший, тому що я не роблю регресії, щоб отримати пристосування, а навпаки, я базую додатковий параметр NB на зовнішній інформації (я очікую, що співвідношення var / середнє значення буде N). Оскільки Пуассон - особливий випадок, коли N = 1, що я насправді порівнюю, це вибір Н. Я погоджуюся, що якби я робив регресію, NB завжди міг би знайти кращу форму, оскільки це менш обмежено. У моєму випадку, коли я вибираю значення для N вперед, безумовно, можна було б вибрати якесь божевільне значення N, яке погіршує придатність.
chrisamiller

Я, безумовно, буду читати на гладких тестах на корисність, які ви запропонували. Дякую за інформативні відповіді.
chrisamiller

Вибачте за те, що не зрозуміли, що дані не потрапили у вибір параметра передисперсії. Можливо, є якийсь аргумент, щоб зробити це по-своєму, але якщо зовнішня оцінка може відображати те, що ви насправді спостерігаєте, NB може все-таки мати певну перевагу залежно від обставин.
Glen_b -Встановіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.