Яка різниця між тестом МакНемара і тестом чи-квадрата, і як ви знаєте, коли їх використовувати?


30

Я спробував прочитати з різних джерел, але все ще не зрозуміло, який тест був би відповідним у моєму випадку. Є три різні питання, які я задаю про свій набір даних:

  1. Суб'єктів тестують на інфекції від Х у різний час. Хочу знати, чи пропорції додатного для X після пов'язані з часткою додатного для X раніше:

                 After   
               |no  |yes|
    Before|No  |1157|35 |
          |Yes |220 |13 |
    
    results of chi-squared test: 
    Chi^2 =  4.183     d.f. =  1     p =  0.04082 
    
    results of McNemar's test: 
    Chi^2 =  134.2     d.f. =  1     p =  4.901e-31

    З мого розуміння, оскільки дані є неодноразовими заходами, я повинен використовувати тест Макнемара, який перевіряє, чи змінилася частка позитивного для X.

    Але мої запитання, мабуть, потребують тестування в хі-квадраті - тестування, якщо частка позитивного для X після пов'язана з часткою позитивного для X раніше.

    Я навіть не впевнений, чи правильно я розумію різницю між тестом МакНемара і чі-квадратом. Що було б правильним тестом, якби моє запитання було: "Чи частка суб'єктів, інфікованих X після різних, ніж раніше?"

  2. Аналогічний випадок, але там, де замість до і після, я вимірюю дві різні інфекції за один раз:

            Y   
          |no  |yes|
    X|No  |1157|35 |
     |Yes |220 |13 |

    Який тест був би тут правильним, якщо питання "Чи пов'язані більші частки однієї інфекції з більш високими частками Y"?

  3. Якщо моє запитання було "Чи пов'язана інфекція Y під час t2 із зараженням X у момент t1?", Який тест був би доцільним?

                  Y at t2   
                |no  |yes|
    X at t1|No  |1157|35 |
           |Yes |220 |13 |

Я використовував тест Макнемара у всіх цих випадках, але я сумніваюся, чи це правильний тест, щоб відповісти на мої запитання. Я використовую Р. Чи можу я glmзамість цього використовувати двочлен ? Це було б аналогічно тесту чи-квадрата?


1
Ви спробували прочитати тут stats.stackexchange.com/questions/tagged/mcnemar-test теми на тесті Макнемара?
ttnphns

Що ви маєте на увазі під "співвідношенням між двома ймовірностями"?
Майкл М

@ttnphns я все-таки пройшов через них, але не зміг переформулювати це на моє запитання. Після більше роздумів, здається, я можу відповісти на два запитання на основі Q1: Chi-sq сказав би мені, чи пропорція + ve X after пов'язана із пропорцією + ve X раніше, тоді як Mcnemar's скаже мені, чи було зміна пропорцій. Чи правий я?
Анто

Тут не можна використовувати стандартний -тест незалежності, оскільки кожна людина представлена ​​двома значеннями, що викликають невипадкові вибірки. χ2
Майкл М

Дякую @MichaelMayer Я використовував mcnemar's, поки не побачив цього . Там, де це пояснюється Макнемаром, він каже, що відповідь, що робить Chi-sq, відповів би в тому самому випадку. Я дуже здивований. Те, що нам підказує кожен тест, обрамлено на цій сторінці, я мушу піти на Chi-sq, але оскільки вони вимірюють ту саму тему, я повинен вибрати McNemar's!
Анто

Відповіді:


48

Дуже прикро, що тест Макнемара так важко зрозуміти людям. Я навіть помічаю, що вгорі сторінки своєї Вікіпедії вказується, що пояснення на сторінці людям важко зрозуміти. Типовим коротким поясненням тесту Макнемара є або те, що це: "тест хі-квадратів", або "це тест граничної однорідності таблиці на випадок надзвичайних ситуацій". Я вважаю, що жодне з них не є дуже корисним. По-перше, не ясно, що розуміється під "предметами chi-квадрата", тому що ви завжди вимірюєте свої предмети двічі (один раз на кожну змінну) і намагаєтеся визначити взаємозв'язок між цими змінними. Крім того, "гранична однорідність" (Трагічно, що навіть ця відповідь може бути заплутаною. Якщо це так, це може допомогти прочитати мою другу спробу нижче.)

Давайте подивимось, чи зможемо ми обробити процес міркування про ваш головний приклад, щоб побачити, чи можемо ми зрозуміти, чи (і якщо так, то чому) тест МакНемара підходить. Ви поставили:

введіть тут опис зображення

Це таблиця на випадок надзвичайних ситуацій, тому вона конусує аналіз чи-квадрата. Більше того, ви хочете зрозуміти взаємозв'язок між та A f t e r , а тест-хі-квадрат перевіряє співвідношення між змінними, тому на перший погляд здається, що тест-квадрат повинен бути аналіз, який відповідає на ваше запитання. BeforeAfter

Однак варто зазначити, що ми також можемо представити такі дані на зразок:

введіть тут опис зображення

Якщо дивитися на дані таким чином, ви можете подумати, що можете зробити звичайний старий test. Але т -test не зовсім вірно. Є два питання: По-перше, оскільки кожен рядок перераховує дані, виміряні з одного і того ж предмета, ми не хотіли б робити t- test між суб'єктами , ми хотіли б зробити t- test всередині предметів . По-друге, оскільки ці дані поширюються як двочлен , дисперсія є функцією середнього. Це означає, що не виникає додаткової невизначеності, про яку слід турбуватися, як тільки буде оцінено середнє значення вибірки (тобто вам не доведеться згодом оцінювати дисперсію), тому вам не доведеться посилатися на розподіл t , ви можете використовувати zтттттzрозповсюдження. (Більш докладно про це, це може допомогти , щоб прочитати мою відповідь тут: г -test по порівнянні з χ 2 тесту .) Таким чином, ми повинні були б в межах-суб'єктів г -Тест. Тобто нам потрібен тест на предмет рівності пропорцій. zχ2z

Ми бачили, що існує два різних способи мислення та аналізу цих даних (що підштовхується двома різними способами перегляду даних). Тому нам потрібно вирішити, яким способом нам користуватися. Тест у квадраті чи оцінює незалежність та A f t e r . Тобто чи раніше люди, які раніше хворіли, частіше хворіють, ніж люди, які ніколи не хворіли. Вкрай важко зрозуміти, як це не відбудеться, враховуючи, що ці вимірювання оцінюються на одних і тих же предметах. Якщо ви отримали незначний результат (як ви майже робите), це була б просто помилка типу II. Замість того, чи B e fБеfоrеАfтеr і A f t e r є незалежними, ви майже напевно хочете дізнатися, чи працює лікування (на питання хі-квадрат не відповідає). Це дуже схоже на будь-яку кількість лікувальних та контрольних досліджень, де ви хочете перевірити, чи рівні засоби рівні, за винятком того, що в цьому випадку ваші вимірювання так / ні, і вони знаходяться в межах суб'єктів. Розглянемо більш типовий тБеfоrеАfтеrт-тестова ситуація з артеріальним тиском, виміряним до та після лікування. Ті, чий bp раніше був вище середнього показника для вибірки, майже напевно, як правило, будуть серед вищих показників, але ви не хочете знати про послідовність рейтингу, хочете знати, чи призвело лікування до зміни середнього bp . Ваша ситуація тут прямо аналогічна. Зокрема, ви хочете запустити внутрішні предмети -тест рівності пропорцій. Ось у чому полягає випробування МакНемара.z

Отже, зрозумівши, що ми хочемо провести тест МакНемара, як це працює? Запустити -test між суб'єктами легко, але як ми можемо запустити версію в межах предметів? Ключовим моментом для розуміння того, як зробити тест пропорцій у суб'єктах, є вивчення таблиці надзвичайних ситуацій, яка розкладає пропорції:z
Очевидно, щопропорціїBefore- це сумарні рядки, поділені на загальну загальну суму, апропорціїAfter- це стовпці на загальну суму. Переглядаючи таблицю дій на випадок, ми бачимо, що це такі, наприклад:Перед пропорцією так=220+13

АfтеrNоYестоталБеfоrеNо1157 рік351192 рікYес22013233тотал1377 рік481425 рік
БеfоrеАfтеr
Цікаво зазначити, що13спостережень були і до, і після. Вони виявляються частиною обох пропорцій, але внаслідок того, що вони знаходяться в обох розрахунках, вони не додають чіткої інформації про зміну пропорції дріжджів. Більше того, вони рахуються двічі, що недійсне. Так само загальний підсумок закінчується в обох розрахунках і не додає чіткої інформації. Розкладаючи пропорції, ми можемо визнати, що єдина чітка інформація про пропорції до і після пропорцій дріжжів існує в220і35, тому це числа, які нам потрібно проаналізувати. Це було прозрінням МакНемара. Крім того, він зрозумів, що під нулем - це біноміальний тест220/
Перед пропорцією так=220+131425 рік,Після пропорції так=35+131425 рік
1322035 проти нульової частки .5 . (Існує еквівалентна рецептура, яка розподіляється у вигляді чі-квадрата, що і єрезультатом.) 220/(220+35).5R

Існує ще одне обговорення тесту Мак - Немара з розширеннями таблиць спряженості більше , ніж 2х2, тут .


Ось Rдемонстрація ваших даних:

mat = as.table(rbind(c(1157, 35), 
                     c( 220, 13) ))
colnames(mat) <- rownames(mat) <- c("No", "Yes")
names(dimnames(mat)) = c("Before", "After")
mat
margin.table(mat, 1)
margin.table(mat, 2)
sum(mat)

mcnemar.test(mat, correct=FALSE)
#  McNemar's Chi-squared test
# 
# data:  mat
# McNemar's chi-squared = 134.2157, df = 1, p-value < 2.2e-16
binom.test(c(220, 35), p=0.5)
#  Exact binomial test
# 
# data:  c(220, 35)
# number of successes = 220, number of trials = 255, p-value < 2.2e-16
# alternative hypothesis: true probability of success is not equal to 0.5
# 95 percent confidence interval:
#  0.8143138 0.9024996
# sample estimates:
# probability of success 
#              0.8627451 

Якби ми не врахували внутрішньопредметний характер ваших даних, ми мали б дещо менш потужний тест рівності пропорцій:

prop.test(rbind(margin.table(mat, 1), margin.table(mat, 2)), correct=FALSE)
#  2-sample test for equality of proportions without continuity
#  correction
# 
# data:  rbind(margin.table(mat, 1), margin.table(mat, 2))
# X-squared = 135.1195, df = 1, p-value < 2.2e-16
# alternative hypothesis: two.sided
# 95 percent confidence interval:
#  0.1084598 0.1511894
# sample estimates:
#    prop 1    prop 2 
# 0.9663158 0.8364912 

Тобто X-squared = 133.6627замістьchi-squared = 134.215713N=2850 рікN=1425 рік


Ось відповіді на ваші конкретні запитання:

  1. Правильний аналіз - це тест Макнемара (про що детально говорилося вище).
  2. Ця версія є складнішою, і фразування "чи більші частки однієї інфекції відносяться до більш високих пропорцій Y" є неоднозначним. Можливі два питання:

    • Цілком доцільно хотіти знати, чи мають пацієнти, які отримують одну з інфекцій, іншу, і в такому випадку ви використовуєте хі-квадратний тест на незалежність. Це питання задає питання про те, чи сприйнятливість до двох різних інфекцій є незалежною (можливо, тому, що вони заражаються різними фізіологічними шляхами) чи ні (можливо, вони заражені через загально ослаблену імунну систему).
    • Цілком розумно також знати, що якщо однакова частка пацієнтів, як правило, отримує обидві інфекції, і в цьому випадку ви використовували б тест МакНемара. Тут питання полягає в тому, чи є інфекції однаково вірулентними.
  3. Оскільки це знову та сама інфекція, звичайно, вони будуть пов’язані. Я вважаю, що ця версія не до та після лікування, а лише в якийсь пізній момент часу. Таким чином, ви запитуєте, чи не змінюються показники фонової інфекції органічно, що знову-таки є цілком розумним питанням. У будь-якому випадку, правильний аналіз - це тест МакНемара.
    Редагувати: Здавалося б, я неправильно трактував ваше третє запитання, можливо, через помилку друку. Зараз я трактую це як дві різні інфекції у двох окремих часових точках. Згідно з цією інтерпретацією, тест чи-квадрата був би доречним.

@ Алексис Наскільки я можу розібратися, ти і Гунг, здається, розмовляємо повз один одного. Навіть так званий t-тест "непарних" або "незалежних зразків", або "односторонній" або "незалежний зразок ANOVA" насправді вимагає парних даних у сенсі Гунга: для кожного предмета ви повинні записати обидві категоричні групи змінної членства та постійної змінної результатів . (Якщо змінна членства в групі має два рівні, ми зазвичай використовуємо непарний t-тест; для 3+ рівнів потрібна одностороння ANOVA).
Срібна рибка

2
Пояснюючи, який тест використовувати, я показую обидва способи його перегляду - якщо у вас є спостереження за суцільною змінною, по одному для кожного предмета, а суб'єкти походять з 2 (або 3+) груп, і вас цікавлять відмінності між групи, потім використовують t-тест незалежних зразків (або односторонній ANOVA). Потім підтвердьте свій вибір, переглянувши таблицю даних: чи є у вас для кожного предмета дві інформації: категорія для членства в групі та безперервна змінна. Ми навіть можемо перевернути речі і сказати, що t-тест - це свого роду тест на зв'язок між бінарною та безперервною змінною.
Срібна рибка

2
Парний t-тест (або співвіднесені зразки ANOVA) застосовується, якщо для кожного суб'єкта у вас є два (або 3+) безперервних показань, проведених за різних умов, і ви хочете перевірити на відмінності між умовами. Це "в парі" в іншому розумінні. Але в цьому питанні ми маємо дві категоричні змінні, записані для кожного предмета. Дивлячись на таблицю даних, записані значення цих категоричних змінних повинні складатися парами. Але це не означає, що сама конструкція дослідження є парною. Це заплутано (як зазначає Гунг). Але якщо ви знаєте дизайн вашого дослідження, це може вирішити його (як зазначає alexis)
Срібна рибка

@Silverfish Якщо у вас є два спостереження (однакової номінальної змінної), зроблені з кожного предмета, в якому сенсі це не парний дизайн?
Олексій

1
@ Алексис Це "однакова змінна", яка є ключовою - і, можливо, заплутаною. Ви можете знати, що вона являє собою одну і ту ж змінну, хоча і за різних умов або в різний час, але залежно від способу складання таблиці даних вони можуть бути записані як різні змінні (наприклад, окремі "до" і "після" змінна).
Срібна рибка

22

Що ж, здається, я зробив це. Дозвольте спробувати пояснити це ще раз, по-іншому, і ми побачимо, чи це може допомогти з'ясувати речі.

Традиційний спосіб пояснити тест Мак-Немара проти тесту чи-квадрата - це запитати, чи є дані "спареними", і рекомендувати тест Мак-Немара, якщо дані спарені, і тест-квадрат-тест, якщо дані "неспарені". Я виявив, що це призводить до великої плутанини (ця тема є прикладом!). Замість цього я виявив, що найбільш корисно зосередитись на питанні, яке ви намагаєтеся задати , та використати тест, який відповідає вашому питанню. Щоб зробити це більш конкретним, давайте розглянемо складений сценарій:

Ви обходите статистичну конференцію, і за кожним статистиком, який ви зустрічаєте, ви записуєте, чи є вони зі США чи Великобританії. Ви також записуєте, чи має вони високий кров'яний тиск або нормальний артеріальний тиск.

Ось дані:

mat = as.table(rbind(c(195,   5),
                     c(  5, 195) ))
colnames(mat)        = c("US", "UK")
rownames(mat)        = c("Hi", "Normal")
names(dimnames(mat)) = c("BP", "Nationality")
mat
#         Nationality
# BP        US  UK
#   Hi     195   5
#   Normal   5 195

На даний момент важливо з'ясувати, яке питання ми хочемо задати нашим даним. Тут можна задати три різні питання:

  1. Ми можемо хотіти знати, чи категоричні змінні BP і Nationalityпов'язані або незалежні;
  2. Ми можемо поцікавитися, чи високий кров’яний тиск є більш поширеним серед статистиків США, ніж серед статистиків Великобританії;
  3. Нарешті, ми можемо поцікавитися, чи частка статистиків з високим кров’яним тиском дорівнює частці американських статистиків, з якими ми говорили. Це стосується граничних пропорцій таблиці. Вони не друкуються за замовчуванням у R, але ми можемо отримати їх таким чином (зауважте, що в цьому випадку вони точно такі ж):

    margin.table(mat, 1)/sum(mat)
    # BP
    #    Hi Normal 
    #   0.5    0.5 
    margin.table(mat, 2)/sum(mat)
    # Nationality
    #  US  UK 
    # 0.5 0.5 

Як я вже говорив, традиційний підхід, який обговорюється у багатьох підручниках, полягає у визначенні того, який тест використовувати на основі того, чи є дані "парними" чи ні. Але це дуже заплутано, чи ця таблиця дій у випадку надзвичайних ситуацій «парна»? Якщо ми порівнюємо пропорцію з високим артеріальним тиском між статистиками США та Великобританії, то ви порівнюєте дві пропорції (хоч і тієї ж змінної), виміряні на різних групах людей. З іншого боку, якщо ви хочете порівняти пропорцію з високим кров'яним тиском з пропорцією США, ви порівнюєте дві пропорції (хоч і різні змінні), виміряні на одному і тому ж наборі людей. Ці дані є обома"спарені" та "непарні" одночасно (хоча й стосовно різних аспектів даних). Це призводить до плутанини. Щоб спробувати уникнути цієї плутанини, я стверджую, що ви повинні подумати, з якого питання ви ставите. Зокрема, якщо ви хочете знати:

  1. Якщо змінні незалежні: використовуйте тест chi-квадрата.
  2. Якщо пропорція з високим кров'яним тиском відрізняється за національністю: використовуйте z-тест для різниці пропорцій.
  3. Якщо граничні пропорції однакові: скористайтеся тестом МакНемара.

Хтось може не погодитися зі мною тут, аргументуючи це тим, що оскільки таблиця дій у випадку непередбачених ситуацій не є "парною", тест Макнемара не може бути використаний для перевірки рівності граничних пропорцій і що замість цього слід використовувати тест-квадрат. Оскільки це суперечка, давайте спробуємо обидві, щоб результати мали сенс:

chisq.test(mat)
#  Pearson's Chi-squared test with Yates' continuity correction
# 
# data:  mat
# X-squared = 357.21, df = 1, p-value < 2.2e-16
mcnemar.test(mat)
#  McNemar's Chi-squared test
# 
# data:  mat
# McNemar's chi-squared = 0, df = 1, p-value = 1

50%=50%

Спробуємо ще один приклад:

mat2 = as.table(rbind(c(195, 195),
                      c(  5,   5) ))
colnames(mat2)        = c("US", "UK")
rownames(mat2)        = c("Hi", "Normal")
names(dimnames(mat2)) = c("BP", "Nationality")
mat2
#         Nationality
# BP        US  UK
#   Hi     195 195
#   Normal   5   5
margin.table(mat2, 1)/sum(mat2)
# BP
#     Hi Normal 
#  0.975  0.025 
margin.table(mat2, 2)/sum(mat2)
# Nationality
#  US  UK 
# 0.5 0.5 

97.5%50%

chisq.test(mat2)
#  Pearson's Chi-squared test
# 
# data:  mat2
# X-squared = 0, df = 1, p-value = 1
mcnemar.test(mat2)
#  McNemar's Chi-squared test with continuity correction
# 
# data:  mat2
# McNemar's chi-squared = 178.605, df = 1, p-value < 2.2e-16

Цього разу тест чі-квадрата дає р-значення 1, тобто граничні пропорції такі самі, наскільки вони можуть бути. Але ми побачили, що граничні пропорції, очевидно, не рівні, тому цей результат не має сенсу в світлі наших даних. З іншого боку, тест МакНемара дає р-значення приблизно 0. Іншими словами, вкрай малоймовірно отримати дані з граничними пропорціями, настільки далеко від рівності, як ці, якщо вони справді рівні в сукупності. Оскільки наші спостережувані граничні пропорції далеко не рівні, такий результат має сенс.

Той факт, що тест-ква-квадрат дає результати, які не мають сенсу, враховуючи наші дані, говорить про те, що тут не використовується тест хі-квадрата. Звичайно, той факт, що тест Макнемара дав розумні результати, не підтверджує, що він справедливий, можливо, це був просто збіг обставин, але тест з квадратом чі явно помиляється.

Подивимось, чи зможемо ми розглянути аргумент, чому тест Макнемара може бути правильним. Я буду використовувати третій набір даних:

mat3 = as.table(rbind(c(190,  15),
                      c( 60, 135) ))
colnames(mat3)        = c("US", "UK")
rownames(mat3)        = c("Hi", "Normal")
names(dimnames(mat3)) = c("BP", "Nationality")
mat3
#         Nationality
# BP        US  UK
#   Hi     190  15
#   Normal  60 135
margin.table(mat3, 1)/sum(mat3)
# BP
#     Hi Normal 
# 0.5125 0.4875 
margin.table(mat3, 2)/sum(mat3)
# Nationality
#    US    UK 
# 0.625 0.375 

51.25%62.5%

prop.test(x=c(205, 250), n=c(400, 400))
#  2-sample test for equality of proportions with continuity correction
# 
# data:  c(205, 250) out of c(400, 400)
# X-squared = 9.8665, df = 1, p-value = 0.001683
# alternative hypothesis: two.sided
# 95 percent confidence interval:
#   -0.18319286 -0.04180714
# sample estimates:
# prop 1 prop 2 
# 0.5125 0.6250 

(Щоб використати prop.test()для перевірки граничних пропорцій, мені довелося вводити цифри «успіхи» та загальну кількість «випробувань» вручну, але з останнього рядка результату видно, що пропорції є правильними.) Це говорить про те, що навряд чи вдасться отримати граничні пропорції далеко не рівність, якби вони були фактично рівними, враховуючи кількість даних, які ми маємо.

Чи справжній цей тест? Тут є дві проблеми: Тест вважає, що ми маємо 800 даних, коли нас насправді лише 400. Цей тест також не враховує, що ці дві пропорції не є незалежними, в тому сенсі, що вони вимірювалися одними і тими ж людьми.


% висока ВР: 190+15400% НАС: 190+60400
1904001560π=.5під нуль. Це було прозрінням МакНемара. Насправді тест Макнемара є по суті лише біноміальним тестом на те, чи спостереження однаковою мірою потрапляють у ці дві клітини:
binom.test(x=15, n=(15+60))
#  Exact binomial test
# 
# data:  15 and (15 + 60)
# number of successes = 15, number of trials = 75, p-value = 1.588e-07
# alternative hypothesis: true probability of success is not equal to 0.5
# 95 percent confidence interval:
#   0.1164821 0.3083261
# sample estimates:
# probability of success 
#                    0.2 

У цій версії використовуються лише інформативні спостереження, і вони не рахуються двічі. Значення р тут значно менше 0,0000001588, що часто трапляється, коли залежність у даних враховується. Тобто цей тест є більш потужним, ніж z-тест різниці пропорцій. Далі ми можемо побачити, що наведена версія по суті є такою ж, як і тест Мак-Немара:

mcnemar.test(mat3, correct=FALSE)
#  McNemar's Chi-squared test
# 
# data:  mat3
# McNemar's chi-squared = 27, df = 1, p-value = 2.035e-07

Якщо неідентифікація плутанина, тест МакНемара типово, а в R, квадратує результат і порівнює його з розподілом chi-квадрата, що не є точним тестом, як біноміал вище:

(15-60)^2/(15+60)
# [1] 27
1-pchisq(27, df=1)
# [1] 2.034555e-07

Таким чином, коли ви хочете перевірити граничні пропорції таблиці непередбачених ситуацій, рівні тесту МакНемара (або точний біноміальний тест, обчислений вручну) є правильним. Він використовує лише відповідну інформацію без незаконного використання будь-яких даних двічі. Це не просто "трапляється", щоб отримати результати, які мають сенс даних.

Я продовжую вважати, що намагатись з’ясувати, чи є таблиця на випадок надзвичайних ситуацій, не є корисною. Я пропоную скористатися тестом, який відповідає запитанням, про яке ви ставите дані.


1
Ви отримали мій голос. :)
Олексій

11

χ2χ2


χ2

Наприклад, у вас може бути вибірка з 20 статистиків із США та окрема незалежна вибірка з 37 статистиків з Великобританії, і ви можете визначити, чи є ці статистики гіпертонічними та нормотензивними. Ваша нульова гіпотеза полягає в тому, що і статистики Великобританії, і США мають однакову основну ймовірність бути гіпертонічною хворобою (тобто те, що знати, чи є він із США чи з Великобританії, нічого не говорить про ймовірність гіпертонії). Звичайно, можливо, що у вас може бути однаковий розмір вибірки у кожній групі, але це не змінює факту незалежності зразків (тобто непарних ).

Бінарні дані в парних зразках
χ2

Наприклад, у вас можуть бути дані, що відповідають індивідуальному контролю випадків контролю, відібрані з міжнародної конференції статистиків, де 30 статистиків з гіпертонічною хворобою (випадки) та 30 статистиків без гіпертонії (контролі; які індивідуально відповідають віку, статі, ІМТ та статусу куріння для конкретних випадків) ретроспективно оцінюють на професійне проживання у Великобританії порівняно з місцем проживання в інших місцях. Неодмінним є те, що ймовірність проживання у Великобританії серед випадків така сама, як ймовірність проживання у Великобританії як контрольних (тобто те, що знання про гіпотензивний статус людини нічого не говорить про історію проживання у Великобританії).

rсχ2=[(r-с)-1]2(r+с)

Анто, в вашому прикладі, ваші дані в парі ( та ж змінна вимірюється двічі в тій же темі) , і тому тест McNemar є підходящим вибором для тестування асоціації.

[Гунг і я деякий час не погодилися з приводу попередньої відповіді.]

Цитовані посилання
"Припускаючи, що ми все ще зацікавлені в порівнянні пропорцій, що ми можемо зробити, якщо наші дані є парними, а не незалежними? ... У цій ситуації ми використовуємо тест Макнемара". - Пагано і Говрео, Принципи біостатистики , 2-е. видання, сторінка 349. [ Наголос додано ]

"Вираз більш відомий як статистика тестування для парної пари МакНемара (McNemar, 1949) і був основою аналізу парних пар ." - Rothman, Greenland, & Lash. Сучасна епідеміологія , стор. 286. [ Наголос додано ]

"Парний t- тест і повторні заходи дисперсійного аналізу можуть бути використані для аналізу експериментів, в яких змінна, що вивчається, може бути виміряна на інтервальній шкалі (і задовольняє інші припущення, необхідні для параметричних методів). Що стосується експериментів, аналогічних експериментам у главі 5, де результат вимірюється в номінальній шкалі? Ця проблема часто виникає при питанні, відповіла людина на лікування чи ні, коли порівнюють результати двох різних діагностичних тестів, які класифікуються позитивними чи негативними у тих самих осіб . Ми розробимо процедуру аналізу таких експериментів, тест Макнемара на зміни , в контексті одного такого дослідження ". - Гланц, буквар біостатистикиχ2

"Для відповідних даних контрольного випадку з одним контролем на кожний випадок аналіз результатів є простим, а відповідним статистичним тестом є тест МакНемара на чі-квадраті ... зауважте, що для обчислення як коефіцієнта шансів, так і для статистики є єдиними учасниками - це пари, які розрізнені в експозиції , тобто пари, де було викрито випадок, але контролю не було, і ті, де контроль було викрито, але випадку не було. "- Елвуд. Критична оцінка епідеміологічних досліджень та клінічних випробувань , 1-е видання, стор. 189–190. [ Наголос додано ]


7

Я розумію тест Макнемара наступним чином: він використовується для того, щоб визначити, чи втручання змінило суттєвий вплив на бінарний результат. У вашому прикладі група досліджуваних перевіряється на наявність інфекції, і відповідь записується як так чи ні. Після цього всім суб'єктам проводять певне втручання, скажімо, антибіотичний препарат. Потім вони знову перевіряються на наявність інфекції, і реакція записується як так / ні знову. Відповіді (пари) можуть бути поміщені в таблицю суміжності:

             After   
           |no  |yes|
Before|No  |1157|35 |
      |Yes |220 |13 |

І тест Макнемара був би доречним для цього.

З таблиці видно, що багато інших перетворили з "так" на "ні" (220 / (220 + 13) або 94,4%), ніж з "ні" на "так" (35 / (1157 + 35) або 2,9 %). Враховуючи ці пропорції, значення P МакНемара (4,901 -31) виявляється більш правильним, ніж значення Р-chi (0,04082).

Якщо таблиця суміжності представляє 2 різних інфекції (питання 2), то Chi-квадрат буде більш доречним.

Ваше третє запитання неоднозначне: ви спочатку ставите, що стосується Y у t2 та Y у t1, але в таблиці ви пишете "X" у t1 проти Y у t2. Y при t2 проти Y в t1 - це те саме, що і ваше перше запитання, і тому потрібен тест МакНемара, тоді як X при t1 і Y при t2 вказують на порівняння різних подій, і тому Chi-квадрат буде більш доречним.

Редагувати: Як згадував Алексіс у коментарі, дані контрольованих випадків контролю також аналізуються тестом МакНемара. Наприклад, на дослідження набирається 1425 хворих на рак, і для кожного пацієнта також набирається відповідна контрольна група. Усі ці (1425 * 2) перевірені на наявність інфекції. Результати кожної пари можуть бути показані у подібній таблиці:

             Normal   
           |no  |yes|
Cancer|No  |1157|35 |
      |Yes |220 |13 |

Більш чітко:

                                    Normal:
                                    No infection   Infection  
Cancer patient:     No infection    1157            35      
                    Infection       220             13      

Це свідчить про те, що набагато частіше хворі на рак мали інфекцію, а контроль - не навпаки. Його значення можна перевірити за допомогою тесту Макнемара.

Якщо ці пацієнти та контрольні засоби не відповідали та незалежними, можна лише зробити наступну таблицю і зробити тест «чіскард»:

            Infection
            No    Yes
Cancer  No  1377   48
        Yes 1192  233

Більш чітко:

                No infection        Infection
No cancer       1377                48
Cancer          1192                233

Зауважте, що ці числа збігаються з полями першої таблиці:

> addmargins(mat)
      After
Before   No  Yes  Sum
   No  1157   35 1192
   Yes  220   13  233
   Sum 1377   48 1425

Це повинно бути причиною використання таких термінів, як "граничні частоти" та "гранична однорідність" в тесті МакНемара.

Цікаво, що функція addmargins також може допомогти вирішити, який тест використовувати. Якщо загальна сума становить половину кількості спостережуваних (що свідчить про пару), застосовується тест Макнемара, інакше доцільне тестування:

> addmargins(mat)
      Normal
Cancer   No  Yes  Sum
   No  1157   35 1192
   Yes  220   13  233
   Sum 1377   48 1425
> 
> addmargins(mat3)
      Infection
Cancer   No  Yes  Sum
   No  1377   48 1425
   Yes 1192  233 1425
   Sum 2569  281 2850

Коди R для наведених вище таблиць є відповідями вище:

mat = as.table(rbind(c(1157, 35), 
                      c( 220, 13) ))
colnames(mat) <- rownames(mat) <- c("No", "Yes")
names(dimnames(mat)) = c("Cancer", "Normal")

mat3 = as.table(rbind(c(1377, 48), 
                     c(1192, 233) ))
colnames(mat3) <- rownames(mat3) <- c("No", "Yes")
names(dimnames(mat3)) = c("Cancer", "Infection")

Наступний псевдокод також може допомогти дізнатися різницю:

subject_id      result_first_observation    result_second_observation   
1               no                          yes                     
2               yes                         no                      
...

mcnemar.test(table(result_first_observation, result_second_observation))



pair_id     result_case_subject     result_control_subject  
1           no                      yes                     
2           yes                     no                      
...

mcnemar.test(table(result_case_subject, result_control_subject))



subject_id      result_first_test       result_second_test
1               yes                     no
2               no                      yes
..

chisq.test(table(result_first_test, result_second_test))

Редагувати:

mid-pваріація пеформного тесту McNemar ( https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3716987/ ) цікава. Він порівнює bта cтаблицю на випадок надзвичайних ситуацій, тобто число, яке змінилося з "на" на "проти" чисельності, яке змінилося з "на" на "(ігнорування кількості тих, хто залишився" так "або" ні "в ході дослідження. Це можна виконати за допомогою біноміального тесту в python, як показано на https://gist.github.com/kylebgorman/c8b3fb31c1552ecbaafb

Це може бути еквівалентно binom.test(b, b+c, 0.5)тому, що у випадковій зміні можна було bб дорівнювати c.


3
Не тільки для аналізу втручання: він використовується для аналізу відповідних даних щодо контролю випадків у спостережному сенсі.
Олексій

З огляду на опис / налаштування перед таблицею для Q3, я підозрюю, що "X" - це помилка друку, але це був хороший улов, і це корисний внесок у нитку +1.
gung - Відновіть Моніку

@mso Відредаговано Q3. це X на t1! інакше, як ви кажете, це не відрізняється від Q1. цьому Q більше року, і я здивований, коли хтось повертається до нього з тими ж думками, які мене бентежили. Слідом за великим інтересом!
Анто,

Мої вибачення, ОП уточнила Q3, очевидно, що це 2 різні захворювання в 2 різні часи. Знову хороший улов.
gung - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.