Чому для тесту Макнемара використовується хі-квадрат, а не нормальний розподіл?


11

Я щойно помітив, як неточний тест Макнемара використовує асимптотичний розподіл квадратних чі. Але оскільки точний тест (для двох таблиць випадку) спирається на біноміальне розподіл, то чому не звичайно припускати нормальне наближення до біноміального розподілу?

Дякую.

Відповіді:


15

Близька до інтуїтивної відповідь:

Розгляньте детальніше формулу тесту МакНемара, наведену в таблиці

      pos | neg
----|-----|-----
pos |  a  |  b
----|-----|-----
neg |  c  |  d

Статистика McNemar Mобчислюється як:

М=(б-c)2б+c

Визначення розподілу з k ступенями свободи полягає в тому, що він складається з суми квадратів k незалежних стандартних нормальних змінних. якщо 4 числа досить великі, і , отже, і можуть бути наближені нормальним розподілом. З огляду на формулу M, легко видно, що при досить великих значеннях дійсно буде слідувати приблизно розподіл з 1 ступенем свободи.χ 2χ2bcb-cb+cMχ2


РЕДАКТУВАННЯ: Як прямо вказується, нормальне наближення насправді повністю рівнозначне. Це досить тривіально, враховуючи аргумент, використовуючи наближення b-cнормальним розподілом.

Точна біноміальна версія також еквівалентна тесту знаків, в тому сенсі, що в цій версії біноміальний розподіл використовується для порівняння bз . Або можна сказати, що за нульовою гіпотезою розподіл b можна наблизити .N ( 0,5 × ( b + c ) , 0,5 2 × ( b + c )Бiном(б+c,0,5)N(0,5×(б+c),0,52×(б+c)

Або, рівнозначно:

б-(б+c2)б+c2N(0,1)

що спрощує до

б-cб+cN(0,1)

або, якщо взяти квадрат з обох сторін, до .Мχ12

Отже, нормальна апроксимація буде використовуватися. Це те саме, що наближення .χ2


3
Це вірно. Зв'язок, можливо, видно більш чітко, розглядаючи Sqrt (M) = (bc) / Sqrt (b + c). Апроксимуючи дисперсію b як b та дисперсію c як c (як це прийнято для підрахованих даних), ми бачимо, що Sqrt (M) виглядає як приблизно нормальна величина (bc), поділена на її стандартне відхилення: іншими словами, це виглядає як стандартна нормальна змінна. Фактично, ми могли б провести еквівалентний тест, посилаючись на Sqrt (M) до таблиці стандартного нормального розподілу. Ефективне квадратування робить тест симетричним двостулковим. Очевидно, це руйнується, якщо або b, або малий.
whuber

Дякую за інтуїтивну відповідь Йоріс. Тим не менш, чому частіше використовувати це наближення, а не використовувати нормальне наближення до точного біноміального тесту МакНемара?
Тал Галілі

@Tal: Це те саме. Дивіться відповідь на скасування та мою редагування.
Joris Meys

Власне - останнє питання. Тож якщо обидва однакові (і я думаю, вам також може знадобитися "абсолютне значення" навколо Bc), то чому люди йдуть на розподіл чі, а не залишатися з нормальним? Де перевага?
Тал Галілі

1
@Tal: Ви знаєте, що Р. побудував chi2 з одним ступенем свободи, ви побачите.
Хоріс Майс

8

Чи не підходити два підходи до одного і того ж? Відповідне розподіл chi-квадрата має одну ступінь свободи, тому просто розподіл квадрата випадкової величини зі стандартним нормальним розподілом. Мені доведеться пройти алгебру, щоб перевірити, на що я зараз не маю часу зробити, але я буду здивований, якщо ви не знайдете абсолютно однакову відповідь в обох напрямках.


дивіться мою відповідь для подальшої розробки
Joris Meys

Привіт onestop - Оскільки обидва є асимптотичними, то для менших N вони можуть дати дещо інші результати. У такому випадку мені цікаво, чи вибір вибору з квадратом є тому, що це краще, ніж звичайне наближення, або через історичні причини (а може, як ви запропонували - вони завжди дають однакові результати)
Тал Галілі

@Tal: для менших N жодна з обох не дотримується. І як показано в моїй редакції, вони абсолютно однакові.
Joris Meys
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.