Яка статистика тесту в точному тесті Фішера?


9

Для таблиці на випадок 2 на 2 дехто сказав , що точний тест Фішера використовує підрахунокX1,1у клітині (1,1) таблиці як тестова статистика, і за нульової гіпотези матиме гіпергеометричний розподіл.X1,1

Дехто сказав, що його тестова статистика де - середнє значення гіпергеометричного розподілу (згадане вище) під нулем. Також було сказано, що значення р визначається на основі табеля гіпергометричного розподілу. Мені було цікаво, чи є якісь причини відняти середнє значення, а потім прийняти абсолютне значення? не має гіпергеометричного розподілу під нулем, чи не так?

|X1,1μ|
мк|Х1,1-мк|

Відповіді:


10

(Щоб зробити наші уявлення трохи точнішими, назвемо "тестовою статистикою" розподіл того, що ми шукаємо, щоб фактично обчислити р-значення. Це означає, що для двосхилого t-тесту наша тестова статистика буде |Т| а не Т.)

Тестова статистика полягає в тому, щоб спонукати впорядкування на вибірковому просторі (або, більш строго, часткове впорядкування), щоб можна було визначити крайні випадки (ті, які найбільш відповідають альтернативі).

У випадку точного тесту Фішера вже є впорядкування в певному сенсі - які ймовірності самих різних таблиць 2x2. Як це відбувається, вони відповідають наказу проХ1,1 в тому сенсі, що або найбільші, або найменші значення Х1,1є "крайніми", і вони також мають найменшу ймовірність. Отже, а не дивіться на значенняХ1,1 у запропонованому вами способі можна просто працювати з великого та малого кінців, на кожному кроці додаючи будь-яке значення (найбільше чи найменше) Х1,1-значити, що вже не є) має найменшу ймовірність, пов'язану з нею, продовжуючи, поки ви не досягнете спостережуваної таблиці; при його включенні повна ймовірність всіх цих крайніх таблиць є р-значенням.

Ось приклад:

гіпергеометрична функція ймовірності

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

Перша колонка є Х1,1 значення, другий стовпець - ймовірності, а третій стовпець - індуковане впорядкування.

Тож у конкретному випадку тестування Фішера точні ймовірності кожної таблиці (рівнозначно, кожної таблиці)Х1,1значення) можна вважати фактичною статистикою тесту .

Якщо ви порівняєте запропоновану статистику тесту |Х1,1-мк|, це спонукає до того ж впорядкування в цьому випадку (і я вважаю, що це робиться в цілому, але я не перевіряв), оскільки великі значення цієї статистики є меншими значеннями ймовірності, тому це однаково можна вважати "статистичним" - але так могло б бути багато інших кількостей - справді будь-які, що зберігають цю впорядкованістьХ1,1s у всіх випадках є еквівалентними тестовими статистичними даними, оскільки вони завжди дають однакові p-значення.

Також зауважте, що з більш точним поняттям "тестова статистика", запроваджене на початку, жодна з можливих статистичних даних тестів для цієї проблеми насправді не має гіпергеометричного розподілу; Х1,1так, але насправді це не є підходящою статистикою тесту для двох тестових тестів (якби ми робили однобічний тест, коли лише більше асоціації в основній діагоналі, а не у другій діагоналі вважалося б узгодженим з альтернативою, то це було б тестова статистика). Це якраз та сама проблема з однохвостими / двохвостими, з якої я почав.

[Редагувати: деякі програми представляють тестову статистику для тесту Фішера; Я припускаю, що це буде обчислення типу -2logL, яке було б асимптотично порівнянне з квадратним чі. Деякі можуть також представити коефіцієнт шансів або його журнал, але це не зовсім рівнозначно.]


Дякую, Glen_b! розповсюдженняХ1,1 під нулем знаходиться гіпергеометричний розподіл, який не є симетричним навколо свого середнього мк. Тож мені було цікаво, чи|Х1,1-мк|це розумна статистика тесту?
Тім

Це здається надзвичайно обґрунтованою статистикою тесту, оскільки вона повністю інтерпретована і легко зрозуміла. Адже жодна з можливих статистичних даних не матиме симетричного розподілу. Давайте на мить забудемо специфіку тесту Фішера - якщо ця статистика має для вас значення, ви можете вирахувати точний тест на цій основі (використовуючи гіпергеометричні обчислення для пошуку ймовірностей). Якщо ви хочете показати, що вони викликають однакове замовлення у всіх випадках, це, мабуть, нове питання.
Glen_b -Встановіть Моніку

6

|Х1,1-мк| не може мати гіпергеометричного розподілу взагалі тому, що мк не потрібно бути цілим значенням і тоді |Х1,1-мк|не було б цілим числом. Але умовно на полях,Х1,1 матиме гіпергеометричний розподіл.

Якщо ви робите це правильно і фіксуєте поля до відомих значень, можете розглянути Х1,1(або будь-яку іншу клітинку) для вашої статистики. З аналогією малюванняк кульки з урни, що містять W білі кульки та Б чорні кульки без заміни, Х1,1 можна інтерпретувати як кількість намальованих білих куль, де Б - сума першого ряду, W - сума другого ряду, к - це сума першого стовпця.


4

Насправді його немає. Статистика тестів - це історична аномалія - ​​єдина причина, за якою ми маємо тестову статистику, - це досягти р-значення. Точний тест Фішера проходить повз тестову статистику і переходить прямо до p-значення.


Дякую, але чи справді не існує тестової статистики? Як ви визначаєте значення р тоді?
Тім

Результатом точного тесту Фішера є р-значення.
Джеремі Майлз

@JeremyMiles: Ви маєте на увазі статистику тестів - це історичні аномалії в тому, що перед обчисленнями з низькими витратами користувачі розраховували Z, t і так далі, а потім порівнювали цю тестову статистику з попередньо розрахованими таблицями, щоб визначити статистичну значимість, і як результат, чимало сучасних користувачів інфекційної статистики все ще думають з точки зору тестової статистики, коли вони могли так само легко надати p-значення? Іншими словами, це такий собі поколільний ефект?
рабідотер

1
@rabidotter - так, мабуть, я так і роблю. Ви бачите людей, які пишуть "F = 14,352, df = 2, 568, p <0,05". Насправді, єдина причина, кого когось хвилює F, - це обчислити P, але вони дають F великій точності, а p - дуже малою точністю.
Джеремі Майлз
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.