(Щоб зробити наші уявлення трохи точнішими, назвемо "тестовою статистикою" розподіл того, що ми шукаємо, щоб фактично обчислити р-значення. Це означає, що для двосхилого t-тесту наша тестова статистика буде | Т| а не Т.)
Тестова статистика полягає в тому, щоб спонукати впорядкування на вибірковому просторі (або, більш строго, часткове впорядкування), щоб можна було визначити крайні випадки (ті, які найбільш відповідають альтернативі).
У випадку точного тесту Фішера вже є впорядкування в певному сенсі - які ймовірності самих різних таблиць 2x2. Як це відбувається, вони відповідають наказу проХ1 , 1 в тому сенсі, що або найбільші, або найменші значення Х1 , 1є "крайніми", і вони також мають найменшу ймовірність. Отже, а не дивіться на значенняХ1 , 1 у запропонованому вами способі можна просто працювати з великого та малого кінців, на кожному кроці додаючи будь-яке значення (найбільше чи найменше) Х1 , 1-значити, що вже не є) має найменшу ймовірність, пов'язану з нею, продовжуючи, поки ви не досягнете спостережуваної таблиці; при його включенні повна ймовірність всіх цих крайніх таблиць є р-значенням.
Ось приклад:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
x prob rank
1 0 1.871194e-04 2
2 1 5.613581e-03 4
3 2 5.052223e-02 6
4 3 1.886163e-01 8
5 4 3.300786e-01 10
6 5 2.829245e-01 9
7 6 1.178852e-01 7
8 7 2.245433e-02 5
9 8 1.684074e-03 3
10 9 3.402171e-05 1
Перша колонка є Х1 , 1 значення, другий стовпець - ймовірності, а третій стовпець - індуковане впорядкування.
Тож у конкретному випадку тестування Фішера точні ймовірності кожної таблиці (рівнозначно, кожної таблиці)Х1, 1значення) можна вважати фактичною статистикою тесту .
Якщо ви порівняєте запропоновану статистику тесту |Х1, 1- мк|, це спонукає до того ж впорядкування в цьому випадку (і я вважаю, що це робиться в цілому, але я не перевіряв), оскільки великі значення цієї статистики є меншими значеннями ймовірності, тому це однаково можна вважати "статистичним" - але так могло б бути багато інших кількостей - справді будь-які, що зберігають цю впорядкованістьХ1 , 1s у всіх випадках є еквівалентними тестовими статистичними даними, оскільки вони завжди дають однакові p-значення.
Також зауважте, що з більш точним поняттям "тестова статистика", запроваджене на початку, жодна з можливих статистичних даних тестів для цієї проблеми насправді не має гіпергеометричного розподілу; Х1 , 1так, але насправді це не є підходящою статистикою тесту для двох тестових тестів (якби ми робили однобічний тест, коли лише більше асоціації в основній діагоналі, а не у другій діагоналі вважалося б узгодженим з альтернативою, то це було б тестова статистика). Це якраз та сама проблема з однохвостими / двохвостими, з якої я почав.
[Редагувати: деякі програми представляють тестову статистику для тесту Фішера; Я припускаю, що це буде обчислення типу -2logL, яке було б асимптотично порівнянне з квадратним чі. Деякі можуть також представити коефіцієнт шансів або його журнал, але це не зовсім рівнозначно.]