Чи потрібно коригувати нульове підрахунок для випробування співвідношення ймовірності моделей Пуассона / Логінеар?


9

Якщо в таблиці непередбачених ситуацій є 0, і ми встановлюємо вкладені моделі Пуассона / Логінеар (використовуючи glmфункцію R ) для тесту на коефіцієнт вірогідності, чи потрібно нам коригувати дані до встановлення моделей GLM (наприклад, додати 1/2 до всіх підрахунки)? Очевидно, що деякі параметри неможливо оцінити без певного коригування, але як коригування / відсутність коригування впливає на тест LR?


імовірно, glmрутина пробуде, якщо вона не може обробити нулі. ви пробували?
shabbychef

1
так, це не виходить з ладу, але залежно від формули (наприклад, у насиченій моделі) деякі параметри можуть мати ефективно нескінченні стандартні помилки. Моє запитання - чи це проблема, коли робите тест на коефіцієнт ймовірності. Ви все ще можете обчислити ймовірність, навіть якщо деякі параметри не оцінені, ці параметри просто не сприятимуть ймовірності. Що є стандартною практикою і чому?
BR1

Відповіді:


7

Однією з можливостей моделювання регресії в цілому є те, що ви можете згладити ділянки без даних - хоча, як ви вже помітили, час від часу виникають проблеми в оцінці параметрів. Я б запропонував, що якщо ви отримуєте такі речі, як нескінченні стандартні помилки, настав час трохи переглянути свій модельний підхід.

Одна особлива нотка обережності: Існує різниця між тим, що "не рахувати рахунків" у певних верствах, і неможливо, щоб їх було рахувати в цих верствах. Наприклад, уявіть, що ви працюєте над дослідженням психологічних розладів для ВМС США між 2000 та 2009 роками та маєте бінарні терміни регресії як для "Є жінкою", так і для "Служби на підводному човні". Модель регресії може бути в змозі оцінити ефекти, коли обидві змінні = 1, незважаючи на нульовий підрахунок, де обидві = 1. Однак такий умовивід не був би дійсним - така обставина неможлива. Ця проблема називається "непозитивність" і періодично є проблемою у сильно стратифікованих моделях.


@ skyguy94 Як це не дивно - я це знав, я просто забув зазначити використання ретроспективного набору даних>. <. Відредаговано, щоб відобразити це.
Фоміт

Re: "Модель регресії може оцінити ефекти, коли обидві змінні = 1, або взаємодії між цими двома " - я не думаю, що це правда. Якщо у вас є два бінарних предиктори, які ніколи не є "1" разом, то взаємодія є постійною (вона завжди "0"), тому її ефект не визначений.
Макрос

@Macro Ти маєш рацію, я трохи редагую. Я думав про терміни, де вони не є бінарними показниками.
Фоміт

1
(+1) Отже, питання з неправдоподібністю випадку, коли обидва = 1 вбік, оцінка, заснована на моделі, була б просто сумою двох граничних ефектів, які, як ми знаємо, можуть бути дуже оманливими саме по собі :)
Макрос
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.