Вам потрібен тест McNemar ( http://en.wikipedia.org/wiki/McNemar%27s_test , http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3346204/ ). Наведемо приклад:
Вивчено 1300 балів та 1300 відповідних елементів керування. Статус куріння подається наступним чином:
Normal
|no |yes|
Cancer|No |1000|40 |
|Yes |200 |60 |
Кожен запис таблиці показує інформацію про ПІДПРИЄМСТВО ПІДПРИЄМСТВА: 1000 означає 1000 пар контрольованих випадків, і не палило. 40 - кількість пар контрольованих випадків, в яких контролювали курців, а хворих на рак не було тощо. Наступний код R може бути використаний для генерування цієї таблиці та проведення тесту МакНемара.
mat = as.table(rbind(c(1000, 40), c( 200, 60) ))
colnames(mat) <- rownames(mat) <- c("Nonsmoker", "Smoker")
names(dimnames(mat)) = c("Cancer", "Normal")
mat
# Normal
# Nonsmoker Smoker
# Cancer
# Nonsmoker 1000 40
# Smoker 200 60
mcnemar.test(mat)
# McNemar's Chi-squared test with continuity correction
#
#data: mat
#McNemar's chi-squared = 105.34, df = 1, p-value < 2.2e-16
Тест Макнемара також використовується для оцінки впливу втручання на бінарну змінну результату. Пара результатів до і після подається та випробовується як вище.
Редагувати: розширений приклад, поданий @gung, якщо статус паління вказаний у вашому файлі даних myframe frame наступним чином:
pairID cancer control
1 1 1
2 1 1
3 1 0
...
Тест McNemars можна виконати за допомогою наступних R команд:
> tt = with(mydf, table(cancer, control))
> tt
control
cancer 0 1
0 5 1
1 3 2
> mcnemar.test(tt)
McNemar`s Chi-squared test with continuity correction
data: tt
McNemar`s chi-squared = 0.25, df = 1, p-value = 0.6171