Це хороше питання, але велике. Я не думаю, що можу дати повну відповідь, але я викину трохи їжі для роздумів.
По-перше, під вашою верхньою точкою кулі виправлення, про яке ви посилаєтесь, відоме як корекція Йейтса для безперервності . Проблема полягає в тому, що ми обчислюємо дискретну інфекційну статистику:
(Це дискретно, оскільки лише у кінцевій кількості екземплярів, представлених у таблиці непередбачених ситуацій, існує кінцева кількість можливих реалізованих значень, які може приймати ця статистика.) Незважаючи на цей факт, вона порівнюється зпостійнимрозподілом посилань (саме, тоχ2розподілз ступенями свободи(г-1)(з-1)). Це обов'язково призводить до невідповідності на якомусь рівні. З особливо малим набором даних, і якщо деякі клітинки мають очікувані значення менше 5, можливо, p-значення може бути занадто малим. Корекція Йейта коригує це.
χ2=∑(O−E)2E
χ2 (r−1)(c−1)
За іронією долі, та сама основна проблема (дискретно-безперервна невідповідність) може призвести до занадто високих p-значень . Зокрема, p-значення умовно визначається як ймовірність отримання даних, які є настільки ж крайніми або більшиминіж спостережувані дані. Під постійними даними розуміється, що ймовірність отримати будь-яке точне значення зникає мало, і тому ми справді маємо ймовірність даних, які є більш екстремальними. Однак з дискретними даними існує кінцева ймовірність отримання даних так само, як і ваші. Тільки обчислення ймовірності отримання даних більш екстремальними, ніж ваші, дає занадто низькі номінальні значення p (що призводить до збільшення помилок типу I), але включаючи ймовірність отримання даних, таких як ваші, призводить до занадто високих номінальних p-значень (що призведе до збільшення помилок типу II). Ці факти спонукають думку про середнє значення p . При такому підході значення р - це ймовірність даних більш екстремальних, ніж ваша плюс половина ймовірність даних така сама, як і ваша.
Як ви зазначаєте, існує багато можливостей для тестування даних таблиці надзвичайних ситуацій. Найбільш повне лікування плюси і мінуси різних підходів тут . Цей папір характерний для таблиць 2x2, але ви все ще можете багато дізнатися про параметри даних таблиці непередбачених ситуацій, прочитавши їх.
Я також думаю, що варто серйозно ставитися до моделей. Старіші тести, такі як чі-квадрат, є багатьма людьми швидкими, простими та зрозумілими, але не залишають вас так само всебічно розуміти свої дані, як ви отримуєте від створення відповідної моделі. Якщо обґрунтовано розглядати рядки [стовпці] таблиці непередбачених ситуацій як змінну відповіді, а стовпці [рядки] як пояснювальні / прогнозні змінні, підхід до моделювання дотримується досить легко. Наприклад, якщо у вас було всього два ряди, ви можете побудувати логістичну регресійну модель; якщо є кілька стовпців, ви можете використовувати опорне кодування комірок (фіктивне кодування) для побудови моделі типу ANOVA. З іншого боку, якщо у вас більше двох рядів, багаточленна логістична регресіяможе використовуватися таким же чином. Якщо ваші рядки мають внутрішній порядок, порядкова логістична регресія дала б кращі показники багаточленним. Мовна лінійна модель (регресія Пуассона), ймовірно, менш актуальна, якщо ви не маєте таблиць на випадок надзвичайних ситуацій з більш ніж двома вимірами.
Для всебічного опрацювання таких тем найкращими джерелами є книги Агресті: або його повномасштабне звернення (більш суворе), його вступна книга (легше, але все-таки всеохоплююча і дуже хороша), або, можливо, також його порядкова книга .
Оновлення: Просто задля повноти списку можливих тестів, мені здається, що ми можемо додати цейG2-test
G2=∑O⋅ln(OE)