Чому Anova () та drop1 () надали різні відповіді для GLMM?

У мене є GLMM форми:

lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + 
                (1 | factor3), family=binomial)

Під час використання drop1(model, test="Chi")я отримую інші результати, ніж якщо я використовую Anova(model, type="III")з автомобільного пакета або summary(model). Ці два останні дають однакові відповіді.

Використовуючи купу сфабрикованих даних, я виявив, що ці два способи зазвичай не відрізняються. Вони дають однакову відповідь як для збалансованих лінійних моделей, неврівноважених лінійних моделей (де нерівні n у різних групах), так і для збалансованих узагальнених лінійних моделей, але не для збалансованих узагальнених лінійних змішаних моделей. Отже, виявляється, що лише у випадках, коли включені випадкові чинники, цей розлад проявляється.

Чому між цими двома методами є розбіжність?
При використанні GLMM слід Anova()або drop1()використовувати?
Різниця між цими двома досить незначна, принаймні для моїх даних. Чи має значення навіть те, що використовується?

r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

— tim.farkas
джерело

Я думаю, що це різниця, які тести обчислюються. car::Anovaвикористовує тести Wald, тоді як drop1вдосконалює модель, опускаючи окремі терміни. Джон Фокс одного разу написав мені, що тести Вальда і тести з переобладнаних моделей, використовуючи тести коефіцієнта ймовірності (тобто стратегію з drop1), погоджуються на лінійні, але не обов'язково нелінійні моделі. На жаль, ця пошта була внесена в список і не містила посилань. Але я знаю, що в його книзі є розділ про тести Вальда, який може містити бажану інформацію.

Довідка car::Anovaкаже:

Випробування типу II розраховуються за принципом маргінальності, тестуючи кожен термін після всіх інших, крім ігнорування родичів вищого порядку; так звані випробування типу III порушують маргінальність, випробовуючи кожен термін у моделі після всіх інших. Це визначення випробувань типу II відповідає тестам, що виробляються SAS для моделей дисперсійного аналізу, де всі предиктори є факторами, але не більш загальними (тобто, коли є кількісні прогнози). Будьте дуже обережні при формулюванні моделі тестів III типу, інакше перевірені гіпотези не мають сенсу.

На жаль, я не можу відповісти на ваше друге чи третє запитання, оскільки я також хотів би це знати.

Оновити повторний коментар :

Не існує тестів Wald, LR та F для узагальнених змішаних моделей. Anovaпросто дозволяє проводити "chisq"і "F"тестувати змішані моделі (тобто "mer"об'єкти, повернені lmer). У розділі використання написано:

## S3 method for class 'mer'
Anova(mod, type=c("II","III", 2, 3), 
    test.statistic=c("chisq", "F"), vcov.=vcov(mod), singular.ok, ...)

Але оскільки F-тести для merоб'єктів обчислюються за допомогою pbkrtest, який, Anovaнаскільки мені відомо, працює лише для лінійних змішаних моделей, для GLMM повинні завжди повертатися chisq(отже, ви не бачите різниці).

Оновлення стосовно питання:

Моя попередня відповідь просто намагалася відповісти на ваше головне запитання, різницю між Anova()і drop1(). Але тепер я розумію, що ви хочете перевірити, чи визначені фіксовані ефекти значні чи ні. R-сиг-змішане моделювання FAQ говорить наступне щодо цього:

Тести одиничних параметрів

Від найгіршого до найкращого:

Wald Z-тести

Для збалансованих, вкладених LMM, де можна обчислити df: Wald t-тести

Тест на коефіцієнт ймовірності або встановивши модель так, щоб параметр можна було ізолювати / скидати (через anova або drop1), або за допомогою обчислення ймовірності профілів

MCMC або параметричні інтервали довіри завантаження

Випробування ефектів (тобто тестування того, що кілька параметрів одночасно нульові)

Від найгіршого до найкращого:

Тести Wald chi-kvadrat (наприклад, автомобіль :: Anova)

Тест на коефіцієнт ймовірності (через anova або drop1)

Для збалансованих, вкладених LMM, де можна обчислити df: умовні F-тести

Для LMM: умовні F-тести з корекцією df (наприклад, Kenward-Roger у пакеті pbkrtest)

MCMC або параметричні, або непараметричні порівняння завантажувальної програми (непараметричне завантажувальне завантаження повинно бути ретельно здійснено для врахування факторів групування)

(наголос додано)

Це вказує на те, що ваш підхід до використання car::Anova()для GLMM, як правило, не рекомендується, але слід використовувати підхід MCMC або bootstrap. Я не знаю, чи pvals.fncз languageRпакету прокидається GLMM, але варто спробувати.

— Генрік
джерело

Спасибі, Генріку. Anova () може обчислити три різні тести: Wald, LR та F. Я пробував усі три, але це не має ніякої різниці, що мені здається дивним. У мене таке відчуття, що ця функція відмовиться використовувати тести, які, як вона вважає, не підходять для даних ...

— tim.farkas