Відповідний спосіб поводження з 3-х рівневою таблицею надзвичайних ситуацій


12

У мене є трирівнева таблиця на випадок надзвичайних ситуацій, що містить дані про декілька видів, рослину-господаря, з якої вони були зібрані, і чи відбулося це збирання в дощовий день (це насправді має значення!). Використовуючи R, підроблені дані можуть бути приблизно подібними:

count    <- rpois(8, 10)
species  <- rep(c("a", "b"), 4)
host     <- rep(c("c","c", "d", "d"), 2)
rain     <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)


, , rain = 0

    species
host  a  b
   c 12 15
   d 10 13

, , rain = 1

    species
host  a  b
   c 11 12
   d 12  7

Тепер я хочу знати дві речі: Чи асоціюються види з рослинами-господарями? Чи впливає "дощ чи ні" на цю асоціацію? Я loglm()з MASSза цього:

 # Are species independent to host plants, given the effect of rain?
loglm(~species + host + rain + species*rain + host*rain, data=my.table)

 # Given any relationship between host plants and species, does rain change it?
loglm(~species + host + rain + species*host)

Це трохи поза моїм рівнем комфорту, і я хотів перевірити, чи правильно я встановив моделі і що це найкращий спосіб підійти до цих питань.

Відповіді:


10

Є два способи інтерпретувати своє перше запитання, яке відображено у двох способах, які ви його задали: "Чи пов’язані види з рослинами-господарями?" і "Чи не залежать види, що приймають рослини, впливаючи дощ?"

Перша інтерпретація відповідає моделі спільної незалежності , де зазначено, що види та господарі залежні, але спільно незалежні від того, чи пройшов дощ:

pshr=pshpr

pshr(s,h,r)shrpsh(s,h,)pr

Друга інтерпретація відповідає моделі умовної незалежності , яка стверджує, що види та господарі незалежні, враховуючи, чи дощ був

psh|r=ps|rph|rpshr=psrphr/pr

psh|r(s,h,r)r

Ви можете протестувати ці моделі в R ( loglinтакож спрацювало б добре, але я більше знайомий glm):

count <- c(12,15,10,13,11,12,12,7)
species <- rep(c("a", "b"), 4)
host <- rep(c("c","c", "d", "d"), 2)
rain <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)
my.data <- as.data.frame.table(my.table)
mod0 <- glm(Freq ~ species + host + rain, data=my.data, family=poisson())
mod1 <- glm(Freq ~ species * host + rain, data=my.data, family=poisson())
mod2 <- glm(Freq ~ (species + host) * rain, data=my.data, family=poisson())
anova(mod0, mod1, test="Chi") #Test of joint independence
anova(mod0, mod2, test="Chi") #Test of conditional independence

mod1mod2mod0pshr=psphprsummary(mod2)

Іншим способом підходу до вашого першого питання було б виконати точний тест Фішера ( fisher.test(xtabs(count ~ host + species))) на згорнутій таблиці 2х2 (перша інтерпретація) або тест Мантеля-Хаензеля ( mantelhaen.test(xtabs(count ~ host + species + rain))) для 2-стратифікованих таблиць 2x2 або написати тест на перестановку, що дотримується стратифікації (друга інтерпретація).

Перефразовуючи ваше друге запитання, чи залежить залежність між видами та господарями від того, чи пішов дощ?

mod3 <- glm(Freq ~ species*host*rain - species:host:rain, data=my.data, family=poisson())
mod4 <- glm(Freq ~ species*host*rain, data=my.data, family=poisson())
anova(mod3, mod4, test=”Chi”)
pchisq(deviance(mod3), df.residual(mod3), lower=F)

Повна модель mod4насичена, але ви можете перевірити ефект, про який йде мова, дивлячись на відхилення, mod3як я це робив вище.


Дякую, що заблокували, особливо за те, що допомогли мені розібратися у власному мисленні wrt різниця між умовною та спільною моделлю незалежності
David w

1

hostrainhostrain

Команда R буде:

glm (формула = вид ~ господар + дощ, сімейство = двочлен (logit), ваги = рахується)

p


1
Логістична регресія здається нормальною, але вона додатково обмежує кількість рядків та стовпців, що фіксуються. Це може бути не так у даних про Пуассона. Я вважаю, що відповіді не сильно відрізнятимуться.
suncoolsu

1

Спочатку я запропонував спробувати одну з обмежених методик викреслювання з veganпакету, але, по-друге, подумав, що це буде корисно, оскільки у вас фактично є дві таблиці на випадок надзвичайних ситуацій. Я сподіваюся, що друга частина цього прикладу [PDF: демонстрація R - категоричний аналіз] буде корисною.


Думаєте, що посилання розірвана, ви мали на увазі цю категоричну тут ? Це було корисно, дякую!
david w

Так, здається, що пробіл в URL-адресі його порушує.
ils
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.