Я працюю над прикладами в аналізі даних Doing Bayesian Kruske , зокрема експоненціальної пуассонової ANOVA в гл. 22, який він подає як альтернативу часто-часто-тестовим тестам незалежності для таблиць на випадок надзвичайних ситуацій.
Я бачу, як ми отримуємо інформацію про взаємодії, які трапляються більш-менш часто, ніж можна було б очікувати, якби змінні були незалежними (тобто коли ІРР виключає нуль).
Моє запитання полягає в тому, як я можу обчислити чи інтерпретувати розмір ефекту в цій рамці? Наприклад, Крушке пише, що "поєднання блакитних очей з чорним волоссям трапляється рідше, ніж можна було б очікувати, якби колір очей та колір волосся були незалежними", але як можна описати силу цієї асоціації? Як я можу сказати, які взаємодії більш екстремальні, ніж інші? Якби ми провели хі-квадратний тест цих даних, ми могли б обчислити V Крамера як міру загального розміру ефекту. Як я можу виразити розмір ефекту в цьому байєсівському контексті?
Ось автономний приклад із книги (зашифрований R
), на всякий випадок, коли відповідь буде прихована від мене просто перед очима ...
df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15,
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond",
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))
df
Blue Brown Green Hazel
Black 20 68 5 15
Blond 94 7 16 10
Brunette 84 119 29 54
Red 17 26 14 14
Ось частість випуску з розмірами ефекту (не в книзі):
vcd::assocstats(df)
X^2 df P(> X^2)
Likelihood Ratio 146.44 9 0
Pearson 138.29 9 0
Phi-Coefficient : 0.483
Contingency Coeff.: 0.435
Cramer's V : 0.279
Ось байєсівський вихід з HDI та ймовірностями комірок (безпосередньо з книги):
# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R",
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")
# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))
# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))
Ось сюжети задньої частини експоненціальної моделі Пуассона, застосовані до даних:
І графіки заднього розподілу на оцінені ймовірності комірок: