Що таке тета при негативній біноміальній регресії з R?


26

У мене виникло питання щодо негативної біноміальної регресії: Припустимо, у вас є такі команди:

require(MASS)
attach(cars)
mod.NB<-glm.nb(dist~speed)
summary(mod.NB)
detach(cars)

(Зауважте, що автомобілі - це набір даних, який доступний в R, і мені не дуже важливо, чи має ця модель сенс.)

Що я хотів би знати: це як інтерпретувати змінну theta(повернуту внизу виклику summary). Це параметр форми розподілу негбінів і чи можна інтерпретувати його як міру косості?


Короткий огляд того, що говорить MASS, є тут .
Scortchi

Відповіді:


17

Так, thetaце параметр форми негативного біноміального розподілу, і ні, ви не можете реально інтерпретувати його як міру косості. Точніше:

  • косоокість буде залежати від значення theta, а також від середнього значення
  • немає жодної цінності, thetaяка б гарантувала вам відсутність перекосу

Якщо я не зіпсував це, в mu/ thetaпараметризації, використовуваній при негативній біноміальній регресії, косостість

Sкеш(NБ)=θ+2мкθмк(θ+мк)=1+2мкθмк(1+мкθ)

У цьому контексті зазвичай трактується як міра наддисперсії щодо розподілу Пуассона. Дисперсія від'ємного двочлена становить μ + μ 2 / θ , тому θ дійсно контролює надмірну мінливість порівняно з Пуассоном (яка була б μ ), а не перекосом.θμ+μ2/θθμ


спасибі поки! Це гарна допомога ... Але: Як я можу інтерпретувати високі або (низькі) значення тети? У книзі Макколлауза узагальнені лінійні моделі є посилання на цей документ від анкомби, щоб зробити інтерпретацію k. Але, на жаль, я цього не розумію. Стаття claremontmckenna.edu/facultysites/math/FacMember/MOneill/…
MarkDollar

Вам просто потрібно прочитати першу сторінку. Тож тета (або k в анкомбі) є параметром форми розподілу негбінів і він управляє, якщо розподіл ближче до гамма (k -> 0) або пуассона (k -> нескінченність). Але що це означає підходить? Як я можу інтерпретувати тету, наприклад, для оцінки автомобілів?
MarkDollar

33

Мене на цьому веб-сайті звернув один із моїх студентів на моєму курсі « Лікування даних про моделювання» . Здається, існує багато дезінформації щодо негативної біноміальної моделі, особливо стосовно статистики дисперсії та параметра дисперсії.

мкglmglm.nb θ

glm.nbglmμ+μ2θмк+αмк2glm.nbglmglm.nbмабуть, взяв непрямі стосунки від McCullagh & Nelder, але Нельдер (який був співзасновником GLM в 1972 р.) написав свою надбудову до системи kk до Genstat в 1993 році, в якій він стверджував, що прямі стосунки є кращими. Він та його дружина відвідували мене та мою родину близько кожного іншого року в Арізоні, починаючи з початку 1993 року до року, поки він не помер. Ми обговорили це досить ґрунтовно, оскільки я вклав прямі стосунки у програму glm, яку я написав наприкінці 1992 року для програм Stata та Xplore та для макроса SAS у 1994 році.

nbinomialФункція в пакеті MSME на CRAN дозволяє користувачеві використовувати пряме ( по замовчуванню) або непрямим ( в якості опції, щоб дублювати glm.nb) параметризацію, а також надає статистику Пірсона і залишки на вихід. Вихід також відображає статистику дисперсії та дозволяє користувачеві параметризуватиαθnbinomial


2
ϕcоv(β^)=ϕ(ХТŴ^Х)-1θмкθ"форма" - останню з яких я не вважаю необгрунтованою, оскільки це, безумовно, впливає на форму.
Момо

Який діапазон тети? Чи має тета бути величиною більшою за одиницю?
News_is_Selection_Bias

2

glm посилання негативний двочлен: введіть тут опис зображення

Вікіпедія негативний двочлен "r" - це "тета" glm, що означає, що glm "тета" є параметром форми. Простіше кажучи, "тета" glm - це кількість відмов.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.