Баєсовий аналіз таблиць на випадок надзвичайних ситуацій: Як описати розмір ефекту


9

Я працюю над прикладами в аналізі даних Doing Bayesian Kruske , зокрема експоненціальної пуассонової ANOVA в гл. 22, який він подає як альтернативу часто-часто-тестовим тестам незалежності для таблиць на випадок надзвичайних ситуацій.

Я бачу, як ми отримуємо інформацію про взаємодії, які трапляються більш-менш часто, ніж можна було б очікувати, якби змінні були незалежними (тобто коли ІРР виключає нуль).

Моє запитання полягає в тому, як я можу обчислити чи інтерпретувати розмір ефекту в цій рамці? Наприклад, Крушке пише, що "поєднання блакитних очей з чорним волоссям трапляється рідше, ніж можна було б очікувати, якби колір очей та колір волосся були незалежними", але як можна описати силу цієї асоціації? Як я можу сказати, які взаємодії більш екстремальні, ніж інші? Якби ми провели хі-квадратний тест цих даних, ми могли б обчислити V Крамера як міру загального розміру ефекту. Як я можу виразити розмір ефекту в цьому байєсівському контексті?

Ось автономний приклад із книги (зашифрований R), на всякий випадок, коли відповідь буде прихована від мене просто перед очима ...

df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", 
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))

df

         Blue Brown Green Hazel
Black      20    68     5    15
Blond      94     7    16    10
Brunette   84   119    29    54
Red        17    26    14    14

Ось частість випуску з розмірами ефекту (не в книзі):

vcd::assocstats(df)
                    X^2 df P(> X^2)
Likelihood Ratio 146.44  9        0
Pearson          138.29  9        0

Phi-Coefficient   : 0.483 
Contingency Coeff.: 0.435 
Cramer's V        : 0.279

Ось байєсівський вихід з HDI та ймовірностями комірок (безпосередньо з книги):

# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R", 
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")

# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))

# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))

Ось сюжети задньої частини експоненціальної моделі Пуассона, застосовані до даних:

введіть тут опис зображення

І графіки заднього розподілу на оцінені ймовірності комірок:

введіть тут опис зображення

Відповіді:


1

За індексом Крушке лише двічі згадує розмір ефекту, і обидва рази знаходяться в контексті метричної прогнозованої змінної. Але є цей біт на с. 601:

Якщо дослідника цікавлять порушення незалежності, то інтерес викликає масштаби βrc. Модель є особливо зручною для цієї мети, оскільки довільні контрасти взаємодії можуть бути досліджені, щоб визначити, де виникає не залежність.

Отже, я це збираю β1,2є параметром для інтерпретації. ДозволяєS дорівнює сумі добутків усіх коефіцієнтів та їх відповідних х елементів, виключаючи β1,2 і x1,2. З тих пірyiPois(λi) і λi=eβ1,2x1,2+S=eβ1,2x1,2eS. Колиx1,2 = 1, то λi зростає або скорочується на коефіцієнт eβ1,2, ні?


1

Один із способів дослідження розміру ефекту в моделі ANOVA - це перегляд стандартних відхилень "суперпопуляції" та "кінцевої популяції". У вас є двостороння таблиця, тож це 3 дисперсійні компоненти (2 основні ефекти та 1 взаємодія). Це ґрунтується на аналізі mcmc. Ви обчислюєте стандартне відхилення для кожного ефекту для кожного зразка mcmc.

sk=1dk1j=1dk(βk,jβ¯k)2

Де kіндексує "рядок" таблиці ANOVA. Прості коробки зразків mcmcsk проти k є досить повчальними щодо розмірів ефекту.

Ендрю Гельман виступав за такий підхід. Дивіться його документ 2005 року "Аналіз дисперсії: чому він важливіший ніколи"


Цей документ доступний тут .
Шон Пасха

Обидві ці відповіді здаються дуже перспективними, дякую. Хтось із вас досить знайомий, Rщоб показати, як це може бути запрограмовано?
Бен

@seaneaster - дякую за додавання посилання. @ben, ці обчислення в Р. прості. Однак я не впевнений, у якій формі ваші зразки. Ви повинні мати можливість використовувати sd ()комбіновану з однією з функцій "застосувати". Що стосується боксерів, то до них можна отримати основні boxplot ().
ймовірність

Дякую, чи можете ви продемонструвати, використовуючи приклади даних та код у моєму запитанні?
Бен-

Словом, ні, тому що я не розумію коду, який ви опублікували - я не можу побачити, як організовані дані. І як я вже казав, це не важкий аналіз зробити самостійно. Цей підхід обчислює просту міру (стандартне відхилення). Крім того, R-кодування не є частиною вашого запитання - ви запитали про те, як узагальнити аналіз таблиці непередбачених ситуацій.
ймовірністьілогічний
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.