Альтернативи для тестування хі-квадрата на незалежність для таблиць більше 2 х 2


9

Які існують альтернативи тесту чи-квадрата для категоричних змінних з таблицями, розмірами яких перевищують 2 х 2 та комірки з кількістю менше 5, якщо я не хочу об’єднувати класи?


2
Тест Chi-Square також може використовуватися з більшими таблицями, ніж 2х2. Чи можете ви пояснити, чому тест Chi-Square не повинен відповідати вашій проблемі? Крім того, ви могли б викласти проблему, яку ви сподіваєтеся вирішити?
COOLSerdash

У мене є таблиця на випадок 2 х 3, і комірки з кількістю менше 5
Ізраїль,

2
Дякуємо, відредагуйте своє запитання та додайте цю інформацію, оскільки не всі читають коментарі. Звичайне правило щодо тесту Chi-Square полягає в тому, що його результати можуть бути неточними, якщо очікувана кількість осередків нижча за 5. Зазвичай у цих випадках рекомендується проводити тест Фішера . Тест Барнард також може бути варіантом.
COOLSerdash

Відповіді:


15

Тут є деякі поширені непорозуміння. Тест чі-квадрата цілком чудово використовувати для таблиць, розмірів яких більше2×2. Для того, щоб фактичний розподіл статистики тестування хі-квадрата наблизився до розподілу хі-квадрата, традиційною рекомендацією є те, що всі клітини мають очікувані значення5. Тут слід зазначити дві речі:

  1. Не має значення, що таке кількість спостережуваних клітин - вони цілком можуть бути 0без жодних проблем - має значення лише очікуване .

  2. Це традиційне правило, як відомо, занадто консервативне. Це може бути добре мати20% клітин із очікуваними підрахунками <5 до тих пір, поки не очікується підрахунок <1. Подивитися:

Якщо ваші очікувані підрахунки не відповідають цьому більш точному критерію, є кілька альтернативних варіантів:

  1. Ваша найкраща ставка - це, мабуть, імітувати розподіл вибірки тестової статистики або використовувати тест на перестановку. Наприклад, в R ви можете просто встановити chisq.test(..., simulate.p.value=TRUE). Інше програмне забезпечення також повинно зробити це можливим.

  2. Ви можете використати альтернативний тест, наприклад точний тест Фішера. Хоча точний тест Фішера часто рекомендується в цій ситуації, варто зазначити, що він робить різні припущення і може бути невідповідним. А саме, точний тест Фішера передбачає, що кількість рядків і стовпців була встановлена ​​заздалегідь, і лише розташування комбінацій рядків x стовпців може змінюватись (див.: Враховуючи потужність комп'ютерів у ці дні, чи є коли-небудь причина робити тест на квадрат чи-квадратів а не точний тест Фішера? ). Якщо вам незручно з цим припущенням, моделювання чі-квадрата стане кращим варіантом.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.