Які існують альтернативи тесту чи-квадрата для категоричних змінних з таблицями, розмірами яких перевищують 2 х 2 та комірки з кількістю менше 5, якщо я не хочу об’єднувати класи?
Які існують альтернативи тесту чи-квадрата для категоричних змінних з таблицями, розмірами яких перевищують 2 х 2 та комірки з кількістю менше 5, якщо я не хочу об’єднувати класи?
Відповіді:
Тут є деякі поширені непорозуміння. Тест чі-квадрата цілком чудово використовувати для таблиць, розмірів яких більше. Для того, щоб фактичний розподіл статистики тестування хі-квадрата наблизився до розподілу хі-квадрата, традиційною рекомендацією є те, що всі клітини мають очікувані значення. Тут слід зазначити дві речі:
Не має значення, що таке кількість спостережуваних клітин - вони цілком можуть бути без жодних проблем - має значення лише очікуване .
Це традиційне правило, як відомо, занадто консервативне. Це може бути добре мати клітин із очікуваними підрахунками до тих пір, поки не очікується підрахунок . Подивитися:
Якщо ваші очікувані підрахунки не відповідають цьому більш точному критерію, є кілька альтернативних варіантів:
Ваша найкраща ставка - це, мабуть, імітувати розподіл вибірки тестової статистики або використовувати тест на перестановку. Наприклад, в R ви можете просто встановити chisq.test(..., simulate.p.value=TRUE)
. Інше програмне забезпечення також повинно зробити це можливим.
Ви можете використати альтернативний тест, наприклад точний тест Фішера. Хоча точний тест Фішера часто рекомендується в цій ситуації, варто зазначити, що він робить різні припущення і може бути невідповідним. А саме, точний тест Фішера передбачає, що кількість рядків і стовпців була встановлена заздалегідь, і лише розташування комбінацій рядків x стовпців може змінюватись (див.: Враховуючи потужність комп'ютерів у ці дні, чи є коли-небудь причина робити тест на квадрат чи-квадратів а не точний тест Фішера? ). Якщо вам незручно з цим припущенням, моделювання чі-квадрата стане кращим варіантом.