Тест Фішера в R


11

Припустимо, у нас є такий набір даних:

                Men    Women    
Dieting         10      30
Non-dieting     5       60

Якщо я проведу точний тест Фішера в R, то що означає alternative = greater(або менше)? Наприклад:

mat = matrix(c(10,5,30,60), 2,2)
fisher.test(mat, alternative="greater")

Я отримую p-value = 0.01588і odds ratio = 3.943534. Крім того, коли я гортаю рядки таблиці надзвичайних ситуацій так:

mat = matrix(c(5,10,60,30), 2, 2)
fisher.test(mat, alternative="greater")

то я отримую p-value = 0.9967і odds ratio = 0.2535796. Але коли я запускаю дві таблиці надзвичайних ситуацій без альтернативного аргументу (тобто fisher.test(mat)), то я отримую p-value = 0.02063.

  1. Не могли б ви пояснити мені причину?
  2. Також, що є нульовою гіпотезою та альтернативною гіпотезою у наведених вище випадках?
  3. Чи можу я запустити тест рибалки на таблиці на випадок дій:

    mat = matrix(c(5000,10000,69999,39999), 2, 2)

PS: Я не статистик. Я намагаюся вивчити статистику, тому ваша допомога (відповіді простою англійською мовою) буде дуже вдячна.

Відповіді:


11

greater(або less) відноситься до однобічного тесту, порівнюючи нульову гіпотезу p1=p2щодо альтернативи p1>p2(або p1<p2). Навпаки, двосторонній тест порівнює нульові гіпотези з альтернативою, що p1не дорівнює p2.

Для вашої таблиці частка дієт чоловіків становить 1/4 = 0,25 (10 з 40) у вашій вибірці. З іншого боку, частка чоловіків, які не страждають дієтою, становить 1/13 або (5 з 65), що дорівнює 0,077 у вибірці. Тож оцінка для p10,25, а для p20,077. Тому виявляється, що p1>p2.

Ось чому для односторонньої альтернативи p1>p2значення р становить 0,01588. (Невеликі p-значення вказують, що нульова гіпотеза є малоймовірною, і альтернатива є ймовірною.)

Коли альтернатива полягає в тому, p1<p2ми бачимо, що ваші дані вказували на те, що різниця в неправильному (або непередбаченому) напрямку.

Ось чому в цьому випадку р-значення настільки висока 0,9967. Для двосторонньої альтернативи значення р має бути трохи вище, ніж для односторонньої альтернативи p1>p2. Дійсно, воно має значення p, яке дорівнює 0,02063.


1
Фантастичне пояснення. Отже, точний тест рибалки насправді порівнює ймовірності між рядками на відміну від стовпців?
Крістіан

@Christian: Ні, не важливо, чи його рядки чи стовпці як тест рибалки перевіряє наявність кореляції в таблиці дій на випадок. Рядки та стовпці не мають значення безпосередньо. Ви також можете просто переформулювати гіпотезу: замість того, що H0 є "людьми, які курять, вмирають молодше", ви також можете припускати H0: "люди, які вмирають молодше, частіше курять". Результати тесту рибалки скажуть вам, чи підтримує будь-яке спостережуване з'єднання в даних нульову гіпотезу чи ні, але не має значення, яка є незалежною чи залежною змінною, і рівно, що вибір рядків / стовпців не має значення: )
Домінік Пол
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.