Запитання з тегом «overdispersion»

Завищена дисперсія - це коли більша мінливість, ніж повинна бути в даних. Наприклад, дисперсія підрахунків часто більша за середню, тоді як дисперсія Пуассона повинна дорівнювати середній.

4
Чи є тест, щоб визначити, чи є значною мірою перевиконання GLM?
Я створюю Poisson GLMs у Р. Щоб перевірити наявність наддисперсії, я розглядаю співвідношення залишкового відхилення до ступеня свободи, що надається summary(model.name). Чи є значення граничної межі або тест, щоб цей коефіцієнт вважався "значущим"? Я знаю, що якщо це> 1, то дані перерозподіляються, але якщо у мене відношення відносно близькі до …

4
Як мені підходити багаторівнева модель для надмірно дисперсних результатів пуассона?
Я хочу встановити багаторівневий GLMM з розподілом Пуассона (з надмірною дисперсією) за допомогою R. На даний момент я використовую lme4, але я помітив, що нещодавно quasipoissonсім’я була видалена. Я десь бачив, що можна моделювати адитивну наддисперсію для біноміальних розподілів, додаючи випадковий перехоплення з одним рівнем за спостереження. Чи стосується це …

2
Що таке квазібіноміальний розподіл (в контексті ГЛМ)?
Я сподіваюсь, що хтось може надати інтуїтивний огляд того, що таке квазібіномічний розподіл і що він робить. Мене особливо цікавлять такі моменти: Наскільки квазібіноміальне відрізняється від біноміального розподілу. Коли змінна відповіді є пропорцією (приклади значень включають 0,23, 0,11, 0,78, 0,98), квазібіноміальна модель буде працювати в R, але біноміальна модель не …

4
Стратегія вирішення відповідної моделі для підрахунку даних
Яка відповідна стратегія для вирішення, яку модель використовувати для даних лічильників? У мене є кількість даних, які мені потрібні для моделювання як багаторівневої моделі, і мені було рекомендовано (на цьому веб-сайті), що найкращий спосіб зробити це через помилки або MCMCglmm. Однак я все ще намагаюся дізнатися про байєсівську статистику, і …

2
Коли хтось каже, що залишкове відхилення / df повинно бути ~ 1 для моделі Пуассона, наскільки приблизним є приблизний?
Я часто бачив поради щодо перевірки того, чи підходить модель Пуассона надмірно розсіяною, що включає ділення залишкового відхилення на ступінь свободи. Отримане співвідношення має бути «приблизно 1». Питання полягає в тому, про який діапазон ми говоримо для "приблизного" - що таке співвідношення, яке повинно запускати тривогу для розгляду альтернативних форм …

2
Пуассон або квазі-пуассон в регресії з даними підрахунку і перевищенням?
У мене є дані про підрахунок (аналіз попиту / пропозиції з підрахунком кількості клієнтів, залежно від - можливо - багатьох факторів). Я спробував лінійну регресію з нормальними помилками, але мій QQ-графік не дуже хороший. Я спробував перетворення журналу відповіді: ще раз, поганий QQ-графік. Тому зараз я намагаюся регресувати з помилками …

2
Чи насправді * корисні тести на наддисперсність у ГЛМ?
Явище «надмірної дисперсії» в GLM виникає щоразу, коли ми використовуємо модель, яка обмежує дисперсію змінної відповіді, і дані виявляють більшу дисперсію, ніж дозволяє обмеження моделі. Це трапляється зазвичай при моделюванні підрахунку даних за допомогою GLM Poisson, і це може бути діагностовано за допомогою відомих тестів. Якщо тести показують, що є …

2
Моделювання розподілу Пуассона з наддисперсією
У мене є набір даних, який я б очікував, що слідкує за розповсюдженням Пуассона, але він перерозподілений приблизно в 3 рази. В даний час я моделюю цю наддисперсію, використовуючи щось подібне до наступного коду в Р. ## assuming a median value of 1500 med = 1500 rawdist = rpois(1000000,med) oDdist …

2
Завищена дисперсія в логістичній регресії
Я намагаюся зрозуміти поняття наддисперсії в логістичній регресії. Я читав, що наддисперсія - це коли спостерігається дисперсія змінної відповіді більша, ніж можна було б очікувати від біноміального розподілу. Але якщо біноміальна змінна може мати лише два значення (1/0), то як вона може мати середнє та дисперсію? Я добре в тому, …

1
Як боротися із завищеною дисперсією в пуассоновій регресії: квазі-ймовірність, негативна біноміальна GLM або випадковий ефект на рівні предмета?
Я зіткнувся з трьома пропозиціями розібратися із завищеною дисперсією змінної реакції Пуассона та всієї стартової моделі з фіксованими ефектами: Використовуйте квазі-модель; Використовуйте негативний біноміальний GLM; Використовуйте змішану модель з предметним випадковим ефектом. Але що насправді вибрати, і чому? Чи є серед них фактичний критерій?

1
Ідентичні коефіцієнти, оцінені в моделі Пуассона проти Квазі-Пуассона
При моделюванні даних про кількість позовів у страховому середовищі я почав із Пуассона, але потім помітив перевищення рівня. Квазі-Пуассон краще моделював більшу співвідношення середньої дисперсії, ніж основний Пуассон, але я помітив, що коефіцієнти були однаковими як у моделях Пуассона, так і в Квазі-Пуассона. Якщо це не помилка, чому це відбувається? …

1
Альтернативи надмірної дисперсії та моделювання в моделях випадкових ефектів Пуассона із зрушеннями
Я зіткнувся з низкою практичних питань, коли моделював підрахунок даних експериментальних досліджень за допомогою експерименту в рамках предмета. Я коротко описую експеримент, дані та те, що я зробив до цього часу, після чого мої питання Чотири різних фільми були показані на вибірці респондентів послідовно. Після кожного фільму було проведено інтерв'ю, …

2
Як перевірити на наддисперсію в Poisson GLMM з lmer () в R?
У мене є така модель: > model1<-lmer(aph.remain~sMFS1+sAG1+sSHDI1+sbare+season+crop +(1|landscape),family=poisson) ... і це підсумок. > summary(model1) Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS1 + sAG1 + sSHDI1 + sbare + season + crop + (1 | landscape) AIC BIC logLik deviance 4057 4088 -2019 4039 Random …

2
Параметричне моделювання дисперсії даних лічильників
Я шукаю, щоб моделювати деякі дані, але я не впевнений, який тип моделі я можу використовувати. У мене є дані про підрахунок, і я хочу, щоб модель дала параметричні оцінки як середнього, так і дисперсійного даних. Тобто, у мене є різні прогнозні чинники, і я хочу визначити, чи впливає який-небудь …

1
Чому Anova () та drop1 () надали різні відповіді для GLMM?
У мене є GLMM форми: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Під час використання drop1(model, test="Chi")я отримую інші результати, ніж якщо я використовую Anova(model, type="III")з автомобільного пакета або summary(model). Ці два останні дають однакові відповіді. Використовуючи купу сфабрикованих даних, я виявив, що …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.