Встановлення біноміального GLMM (glmer) на змінну відповіді, яка є пропорцією або дробом


11

Я сподіваюся, що хтось може допомогти у тому, що, на мою думку, є відносно простим питанням, і я думаю, що знаю відповідь, але без підтвердження це стало чимось, в чому я просто не можу бути впевненим.

У мене є деякі дані підрахунку як змінної відповіді, і я хочу виміряти, як ця змінна змінюється пропорційною присутністю чогось.

Більш детально, змінна відповіді підраховує наявність комах у ряді ділянок, тому, наприклад, ділянку відбирають у 10 разів, і цей вид може траплятися у 4 рази.

Хочу побачити, чи це співвідноситься з пропорційною присутністю групи видів рослин у загальній спільноті рослин на цих ділянках.

Це означає, що мої дані виглядають так (це лише приклад)

Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence
1, 5, 10, 0.5
2, 3, 10, 0.3
3, 7, 9, 0.6
4, 0, 9, 0.1

Дані також включають випадковий ефект для місця розташування.

Я подумав про два способи, один - це лінійна модель ( lmer) з комахами, перетвореними на пропорцію, наприклад

 lmer.model<-lmer(insectCount/NumberOfInsectSamples~
 ProportionalPlantGroupPresence+(1|Location),data=Data)

Другим буде двочленний GLMM ( glmer), наприклад

glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~
 ProportionalPlantGroupPresence+(1|Location),
 data=Data,family="binomial")

Я вважаю, що біноміальний блиск є правильним методом, проте вони дають досить різні результати. Мені здається, я не знаходжу остаточної відповіді в мережі, не відчуваючи при цьому трохи невпевненості, і хочу переконатися, що я не помиляюся.

Будь-яка допомога чи розуміння альтернативних методів щодо цього буде дуже вдячна.


Відповіді:


19

Біноміальна GLMM - це, мабуть, правильна відповідь.

  • Особливо при невеликій та помірній кількості вибірок (9 та 10 у вашому прикладі), розподіл змінної відповіді, ймовірно, буде гетероскедастичним (дисперсія не буде постійною і, зокрема, залежатиме від середнього рівня систематично) та далеко від нормальності, таким чином, який буде важко перетворити, особливо, якщо пропорції близькі до 0 або 1 для деяких значень змінної предиктора. Це робить GLMM гарною ідеєю.
  • Ви повинні бути обережними для того, щоб перевірити / облік наявності надмірної дисперсії Якщо у вас є одне спостереження (тобто один біноміальний зразок / рядок у вашому кадрі даних) за місцем розташування, ваш (1|Site)випадковий ефект автоматично впорається з цим (хоча див. Harrison 2015 для застереження)
  • якщо попереднє припущення правильне (у вас є лише один біноміальний зразок на місце розташування), то ви також можете помістити це як звичайну біноміальну модель ( glm(...,family=binomial)- у такому випадку ви також можете використовувати квазібіноміальну модель ( family=quasibinomial) як простіший, альтернативний спосіб для обліку наддисперсії
  • якщо вам подобається, ви також можете встановити ваш GLMM з пропорцією як відповідь, якщо ви встановите weightsаргумент, що дорівнює кількості вибірок:

     glmer(insectCount/NumberOfInsectSamples~ProportionalPlantGroupPresence+
           (1|Location),
           weights=NumberofInsectSamples,
           data=Data,family="binomial")

    (це повинно дати однакові результати glmer()відповідно до ваших питань).

Гаррісон, Ксав'є А. " Порівняння випадкових ефектів на рівні спостереження та бета-біноміальних моделей для моделювання наддисперсії біноміальних даних в екології та еволюції ". PeerJ 3 (21 липня 2015 р.): E1114. doi: 10.7717 / peerj.1114.


Привіт Бен, велике спасибі за вашу чітку та вичерпну відповідь!
AL
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.