Інтерпретація моделювання усереднення результатів у R


11

Я намагаюся зрозуміти і знати, про що потрібно повідомити з мого аналізу деяких даних за допомогою усереднення моделі в Р.

Я використовую такий сценарій для аналізу ефекту методу вимірювання над заданою змінною: Ось набір даних: https://www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0

Модель, що підлягає встановленню:

LM.1 <- gls(VMTf ~ turn+sex+method, na.action="na.fail", method = "ML",VMT4)

екскаватор повна модель

require(MuMIn)
d=dredge(LM.1)
print(d)
coefficients(d)

Отримайте підсумкову інформацію всіх моделей для отримання оцінок параметрів

summary(model.avg(d))

Я знаю, що або всі моделі можуть бути усередненими (повне усереднення моделей), або просто їх підмножина (умовне усереднення). Тепер я хотів би знати: коли краще використовувати повне або умовне усереднення, щоб зробити висновки. Що я повинен повідомити про все це для наукової статті? Що саме означає значення Z та пов'язане з ним p для моделювання усереднення ситуації?

Щоб полегшити візуалізацію моїх запитань. Ось таблиця результатів,

> summary(model.avg(d))# now, there are effects

Call:
model.avg(object = d)

Component model call: 
gls(model = VMT ~ <8 unique rhs>, data = VMT4, method = ML, na.action = 
 na.fail)

Component models: 
       df  logLik   AICc delta weight
1       4 -247.10 502.52  0.00   0.34
12      5 -246.17 502.83  0.31   0.29
13      5 -246.52 503.52  1.01   0.20
123     6 -245.60 503.88  1.36   0.17
(Null)  2 -258.62 521.33 18.81   0.00
3       3 -258.38 522.95 20.43   0.00
2       3 -258.60 523.39 20.88   0.00
23      4 -258.36 525.05 22.53   0.00

Term codes: 
method    sex   turn 
     1      2      3 

Model-averaged coefficients:  
(full average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)            42.63521    0.37170     0.37447 113.856  < 2e-16 ***
methodlight chamber    -1.05276    0.36098     0.36440   2.889  0.00386 ** 
methodthermal gradient -1.80567    0.36103     0.36445   4.955    7e-07 ***
sex2                    0.19023    0.29403     0.29548   0.644  0.51970    
turn                    0.05005    0.10083     0.10141   0.494  0.62165    

(conditional average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)             42.6352     0.3717      0.3745 113.856  < 2e-16 ***
methodlight chamber     -1.0528     0.3609      0.3643   2.890  0.00386 ** 
methodthermal gradient  -1.8058     0.3608      0.3642   4.958  7.1e-07 ***
sex2                     0.4144     0.3089      0.3119   1.328  0.18402    
turn                     0.1337     0.1264      0.1276   1.047  0.29492    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Relative variable importance: 
                     method sex  turn
Importance:          1.00   0.46 0.37
N containing models:    4      4    4

Відповіді:


5

Див. Grueber та ін. 2011 р., «Мультимодельний висновок в екології та еволюції: виклики та рішення» Еволюційна біологія 24: 699-711.

Від цілей це дійсно залежить від того, хочете ви використовувати повні або умовні дані. У моєму полі ми використовували б такі критерії, як AICC, щоб визначити, які моделі найбільше підтримуються, а потім використовувати їх як ваш умовний підмножина. Потім ця інформація буде повідомлена. Наприклад, ваші перші чотири моделі знаходяться в межах 2 блоків AIC одна від одної, тому всі вони будуть включені у ваш підмножина. Інші - це вихід (вищий АПК), тому включення інформації від них фактично знизить якість ваших бета-оцінок.


2
Навіть у вашому запропонованому прикладі, але, можливо, будуть деякі терміни, які відображаються у двох із чотирьох "найкращих" моделей. Чи приймаєте ви середнє значення цих двох коефіцієнтів або двох значень і двох нульових значень для двох моделей, де вони не відображаються?
користувач2390246

5

Я думаю, що передумова про різницю між тим, що саме є повними та умовними середніми, є неправильним. Один - це середнє значення, яке включає нулі (повне), а одне не включає нулів (умовне). з файлу довідки для команди model.avg ():

Примітка

Середнє "підмножина" (або "умовне") становить лише серед моделей, де параметр відображається. В якості альтернативи, "повний" середній припускає, що змінна включена в кожну модель, але в деяких моделях відповідний коефіцієнт (і його відповідна дисперсія) встановлюється нулем. На відміну від "середнього підмножини", він не має тенденції зміщення значення від нуля. Середнє "повне" - це тип оцінювача усадки, і для змінних зі слабким відношенням до відповіді вони менші, ніж "підмножина".

Якщо ви хочете використовувати лише підмножину моделей (наприклад, на основі дельта AIC, наприклад), використовуйте аргумент підмножини в model.avg (). Ви все одно отримаєте умовні та повні оцінки, доки в деяких моделях, що включені, відсутні деякі змінні, які мають інші.


Так. Я згоден. Це правильне тлумачення.
ecologist1234
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.