Діагностика для узагальнених лінійних (змішаних) моделей (конкретно залишків)


25

В даний час я борюся з пошуком правильної моделі для складних підрахунків даних (залежна змінна). Я спробував різні моделі (для моїх даних потрібні моделі змішаних ефектів), таких як lmerі lme4(з перетворенням журналу), а також узагальнені лінійні змішані ефекти з різними сімействами, такими як гауссова або негативна двочлен.

Однак я зовсім не впевнений у тому, як правильно діагностувати отримані приступи. Я знайшов багато різних думок на цю тему в Інтернеті. Я думаю, що діагностика за лінійною (змішаною) регресією досить прямолінійна. Ви можете піти вперед і проаналізувати залишки (нормальність), а також вивчити гетероскедастичність, побудувавши встановлені значення порівняно із залишками.

Однак як ви правильно це зробите для узагальненої версії? Зараз зосередимося на негативній біноміальній (змішаній) регресії. Я бачив тут досить протилежні заяви щодо залишків:

  1. Під час перевірки залишків на нормальність у узагальнених лінійних моделях в першій відповіді вказується, що звичайні залишки зазвичай не розподіляються для ГЛМ; Я думаю, це зрозуміло. Однак тоді вказується, що залишки Пірсона та відхилення також не повинні бути нормальними. Тим не менш, друга відповідь зазначає, що залишки відхилення повинні бути звичайно розподілені (поєднані з посиланням).

  2. На те, що залишки відхилень, як правило, розподіляються, натякається в документації на ? Glm.diag.plotsbootпакета R ).

  3. У цій публікації в блозі автор вперше вивчив нормальність того, що я припускаю, є залишками Пірсона для регресійної моделі змішаних ефектів NB. Як і очікувалося (на мою чесну думку), залишки не виявились нормальними, і автор вважав, що ця модель погано підходить. Однак, як зазначено в коментарях, залишки повинні розподілятися відповідно до негативного біноміального розподілу. На мою думку, це наближається до істини, оскільки залишки GLM можуть мати інші дистрибутиви, ніж звичайні. Це правильно? Як перевірити тут такі речі, як гетероцедастичність?

  4. Останній пункт (побудова залишків проти квантових оцінок розподілу) підкреслюється у Ben & Yohai (2004) . В даний час це, здається, шлях для мене.

Коротше кажучи: як ви правильно вивчаєте примірники моделей узагальнених лінійних (змішаних) регресійних моделей конкретно з акцентом на залишки?


1
Залишки для GLM взагалі не є нормальними (див. Тут ), але зауважте, що існує багато видів залишків для GLM. Наприклад, glm.diag.plotsговорить, що це відхилення від ножового відхилення (я підозрюю, що розрізнення важливе). Крім того, я збираю у вас дані про кількість ; ви можете сфокусувати увагу на цьому факті. Наприклад, підрахунки повинні бути (в деякому сенсі) гетероскедастичними. Діагностичні графіки для регресії підрахунку повинні бути корисними для вас (хоча це не стосується аспекту змішаних ефектів).
gung - Відновіть Моніку

Мені знайомий згаданий вами пост. Однак є також твердження, що дозволяє припустити, що залишки (відхилення) повинні бути нормальними, "ми бачимо дуже великі залишки та істотне відхилення залишків відхилення від нормальних (всі говорять проти Пуассона)".
fsociety

Відповіді:


18

Ця відповідь не ґрунтується на моїх знаннях, а цитує те, що Болкер та ін. (2009) писав у впливовій статті в журналі Trends in Ecology and Evolution . Оскільки стаття не є відкритим доступом (хоча пошук її в науковця Google може виявитись успішним, я вважаю, що я навожу важливі уривки, які можуть бути корисними для вирішення частини питань. Отже, знову ж таки, це не те, що я придумав сам, але я думаю вона представляє найкращу згущену інформацію про GLMM (діагностування з урахуванням інтелектуальної інформації), яка надходить прямо вперед і легко зрозуміти стиль письма. Якщо якимось чином ця відповідь з будь-якої причини не підходить, я просто видалю її. корисні стосовно питань діагностики висвітлено усміливий .

Сторінка 127:

Дослідники, які стикаються з ненормальними даними, часто намагаються використовувати ярлики, такі як перетворення даних для досягнення нормальності та однорідності дисперсії, використовуючи непараметричні тести або покладаючись на надійність класичної ANOVA в ненормальність для збалансованих конструкцій [15]. Вони можуть взагалі ігнорувати випадкові ефекти (таким чином здійснюючи псевдорепликацію) або трактувати їх як фіксовані фактори [16]. Однак такі ярлики можуть вийти з ладу (наприклад, дані підрахунку з багатьма нульовими значеннями не можуть бути нормальними шляхом перетворення). Навіть коли вони досягають успіху, вони можуть порушувати статистичні припущення (навіть непараметричні тести роблять припущення, наприклад, про однорідність дисперсії по групах) або обмежують обсяг висновку (не можна екстраполювати оцінки фіксованих ефектів на нові групи). Замість того, щоб ввести свої дані в класичні статистичні рамки, дослідникам слід використовувати статистичні підходи, які відповідають їх даним. Узагальнені лінійні змішані моделі (ГЛМ) об'єднують властивості двох статистичних рамок, які широко використовуються в екології та еволюції, лінійних змішаних моделей (які містять випадкові ефекти) та узагальнених лінійних моделей (які обробляють ненормальні дані за допомогою функцій зв’язку та експоненціальної родини [наприклад нормальні, пуассонові або двочленні розподіли). GLMM - це найкращий інструмент для аналізу ненормальних даних, що передбачають випадкові ефекти: в принципі, все, що потрібно зробити, це вказати розподіл, функцію зв'язку та структуру випадкових ефектів. лінійні змішані моделі (які містять випадкові ефекти) та узагальнені лінійні моделі (які обробляють ненормальні дані за допомогою функцій зв’язку та експоненціальних сімейних розподілів (наприклад, нормальних, пуассонівських або біноміальних) розподілів). GLMM - це найкращий інструмент для аналізу ненормальних даних, що передбачають випадкові ефекти: в принципі, все, що потрібно зробити, це вказати розподіл, функцію зв'язку та структуру випадкових ефектів. лінійні змішані моделі (які містять випадкові ефекти) та узагальнені лінійні моделі (які обробляють ненормальні дані за допомогою функцій зв’язку та експонентних сімейних розподілів (наприклад, нормальних, пуассонівських або біноміальних) розподілів). GLMM - це найкращий інструмент для аналізу ненормальних даних, що передбачають випадкові ефекти: в принципі, все, що потрібно зробити, це вказати розподіл, функцію зв'язку та структуру випадкових ефектів.

Сторінка 129, поле 1:

У невязки вказано overdispersion , тому ми переобладнали дані з моделлю квазі-Пуассона. Незважаючи на великий оціночний параметр масштабу (10,8), дослідницькі графіки не виявили свідчень про виснаження на рівні особин, генотипів чи популяцій. Ми використовували квазі-AIC (QAIC), використовуючи одну ступінь свободи для випадкових ефектів [49], для рандомефекту, а потім для вибору моделі з фіксованим ефектом.

Сторінка 133, вікно 4:

Тут ми окреслимо загальну основу для побудови повної (найскладнішої) моделі, першого кроку в аналізі GLMM. Після цього процесу можна оцінити параметри та порівняти підмоделі, як описано в головному тексті та на малюнку 1.

  1. Вкажіть фіксовану (лікування чи коваріати) та випадкові ефекти (експериментальні, просторові чи часові блоки, особи тощо). Включайте лише важливі взаємодії. Апріорі обмежте модель до можливого рівня складності, виходячи з основних правил (> 5–6 рівнів випадкових ефектів на випадковий ефект та> 10–20 проб на рівень обробки або експериментальної одиниці) та знання адекватних розмірів вибірки, отриманих від попередні дослідження [64,65].

  2. Виберіть розподіл помилок та функцію зв'язку (наприклад, розподіл Пуассона та посилання журналу для даних лічильника, біноміальне розподіл та посилання logit для даних пропорції)

  3. Графічна перевірка : чи варіації даних (перетворені функцією зв’язку) є однорідними між категоріями? Чи є відповіді на трансформовані дані лінійними щодо безперервних предикторів? Чи є чужі люди чи групи? Чи відповідають розподіли в групах передбачуваному розподілу?

  4. ГММ з фіксованим ефектом підходять як до повного (об'єднаного) набору даних, так і до кожного рівня випадкових факторів [28,50]. Оцінені параметри повинні бути приблизно нормально розподілені по групах (параметри на рівні групи можуть мати великі невизначеності, особливо для груп з невеликими розмірами вибірки). За необхідності відрегулюйте модель (наприклад, змініть функцію зв'язку або додайте коваріати).

  5. Підійдіть до повного GLMM. Недостатня пам'ять комп'ютера або занадто повільна: зменшення складності моделі. Якщо оцінка успішна для підмножини даних, спробуйте більш ефективний алгоритм оцінки (наприклад, PQL, якщо це доречно). Нездатність конвергенції (попередження або помилки): зменшити складність моделі або змінити параметри оптимізації (переконайтесь, що отримані відповіді мають сенс). Спробуйте інші алгоритми оцінки. Компоненти нульової дисперсії або особливості (попередження чи помилки): перевірте, чи модель правильно визначена та ідентифікована (тобто теоретично можна оцінити всі компоненти). Зменшити складність моделі. Додавання інформації до моделі (додаткові коваріати або нові угруповання для випадкових ефектів) може полегшити проблеми, як і центрування суцільних коріаріатів шляхом віднімання їх середнього значення [50]. При необхідності виключити випадкові ефекти з повної моделі, випадання (i) термінів, що мають менший внутрішній біологічний інтерес, (ii) терміни з дуже малими розрахунковими відхиленнями та / або великою невизначеністю, або (iii) умови взаємодії. (Помилки конвергенції або нульові відхилення можуть вказувати на недостатню кількість даних.)

  6. χ2

Діаграми залишків повинні використовуватися для оцінки наддисперсії, а трансформовані відхилення повинні бути однорідними по категоріях. Ніде в статті не було сказано, що залишки, як правило, розподіляються нормально.

Я думаю, що причина, чому існують контрастні твердження, відображає те, що GLMM (стор. 127-128) ...

... напрочуд складно використовувати навіть для статистиків. Незважаючи на те, що декілька програмних пакетів можуть працювати з ГЛМ (Таблиця 1), мало екологів та еволюційних біологів знають про різноманітність варіантів чи можливі підводні камені. Рецензуючи документи з екології та еволюції з 2005 року, виявлені Google Scholar, 311 із 537 аналізів GLMM (58%) певним чином використовував ці інструменти (див. Додаткові матеріали в Інтернеті).

І ось кілька повних прикладів з використанням GLMMs включаючи діагностику.

Я усвідомлюю, що ця відповідь більше нагадує коментар, і її слід розглядати як таку. Але розділ коментарів не дозволяє мені додавати такий довгий коментар. Оскільки я вважаю, що цей документ є цінним для цієї дискусії (але, на жаль, за стіною оплати), я вважав, що було б корисно процитувати тут важливі уривки.

Цитовані документи:

[15] - GP Quinn, MJ Keough (2002): Експериментальний дизайн та аналіз даних для біологів, Кембриджський університетський прес.

[16] - MJ Crawley (2002): Статистичні обчислення: вступ до аналізу даних за допомогою S-PLUS, John Wiley & Sons.

[28] - JC Pinheiro, DM Bates (2000): Моделі змішаних ефектів у S та S-PLUS, Springer.

[49] - Ф. Вайда, С. Бланшард (2005): Умовна інформація Akaike для моделей зі змішаними ефектами. Біометріка, 92, с. 351–370.

[50] - А. Гельман, Дж. Хілл (2006): аналіз даних за допомогою регресії та багаторівневих / ієрархічних моделей, Cambridge University Press.

[64] - NJ Gotelli, AM Ellison (2004): Буквар екологічної статистики, Sinauer Associates.

[65] - Ф.Й. Харрелл (2001): стратегії регресійного моделювання, Спрингер.

[66] - Дж. К. Ліндсі (1997): Застосування узагальнених лінійних моделей, Спрингер.

[67] - W. Venables, BD Ripley (2002): Сучасна прикладна статистика з S, Спрингер.


Дякую, це справді корисно, я знав про приклади кодування Болкера, але не справжній документ якось. Мені все ще цікаво, як графічна перевірка застосовується до дуже масштабних даних з тисячами груп. Кілька робіт (таких, як той), які намагаються дати певні вказівки щодо правильної перевірки своїх моделей, стосуються лише невеликих масштабів даних. Тоді набагато простіше вибрати, наприклад, групи та щось уявити. Я дійсно думаю, що хороший науковий внесок можна зробити, якщо хтось перейде через більш складний приклад у майбутньому.
fsociety

1
Я радий, що це було корисно! Я думаю, що представлені приклади вже досить складні (принаймні, для мене). Думаю, більша проблема полягає в тому, що більші набори даних і складніші моделі можуть стати обчислювально нездійсненними, як це зазначається в тексті: "[...] щоб знайти оцінки ML, потрібно інтегрувати ймовірності над усіма можливими значеннями випадкових ефектів. Для GLMM цей розрахунок у кращому випадку повільний, а в гіршому (наприклад, для великої кількості випадкових ефектів) обчислювально нездійсненний ". Що я вважаю дивовижним, і що слід пам’ятати, - це те, що ми використовуємо інструменти, що знаходяться під активним дослідженням!
Стефан

9

Це старе питання, але я вважав, що було б корисно додати, що варіант 4, запропонований ОП, тепер доступний у пакеті DHARMa R (доступний у CRAN, див. Тут ).

Пакет робить візуальні залишкові перевірки, запропоновані прийнятою відповіддю, набагато надійнішими / легшими.

З опису пакета:

Пакет DHARMa використовує підхід на основі моделювання для створення легко інтерпретованих масштабованих залишків із встановлених узагальнених лінійних змішаних моделей. На даний момент підтримуються всі класи 'merMod' з 'lme4' ('lmerMod', 'glmerMod'), 'glm' (включаючи 'negbin' від 'MASS', але виключаючи квазірозподіл) та 'lm' модельні класи. Альтернативно, також можуть бути оброблені моделювання, створені ззовні, наприклад, задні передбачувальні симуляції з програмного забезпечення Bayesian, таких як "JAGS", "STAN" або "BUGS". Отримані залишки стандартизовані до значень від 0 до 1 і можуть бути інтерпретовані так само інтуїтивно, як залишки від лінійної регресії. У пакеті також передбачено ряд сюжетних і тестових функцій для типової проблеми неправильного визначення,


1
Дуже гарне доповнення до цієї нитки!
Стефан
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.