G-тест проти тестування на чи-квадрат Пірсона


10

Я тестую незалежність в таблицю спряженості. Я не знаю, чи краще тест G чи Пірсон чи-квадрат. Розмір вибірки - сотні, але кількість низьких клітин. Як зазначено на сторінці Вікіпедії , наближення до розподілу chi-квадратиком краще для G-тесту, ніж для тесту Хі-квадрата Пірсона. Але я використовую моделювання Монте-Карло для обчислення р-значення, тож чи є різниця між цими двома тестами?N×М


Відповіді:


8

Вони асимптотично однакові. Вони просто різні способи досягнення однієї ідеї. Більш конкретно, тест хір-квадратів Пірсона є тестовим балом, тоді як G-тест є тестом на ймовірність. Щоб краще зрозуміти ці ідеї, можливо, вам допоможе прочитати мою відповідь тут: Чому мої р-значення відрізняються між результатами логістичної регресії, тестом у квадраті та інтервалом довіри для АБО? Щоб відповісти на ваше пряме запитання, якщо ви обчислюєте значення p за допомогою моделювання Монте-Карло, це не має значення; ви можете просто використовувати те, що зручніше для вас. Зауважте, що з низькою кількістю клітин немає проблем, очікується лише (потенційно) низький рівенькількість клітин; можливо низький вміст клітин і очікувані підрахунки, які є просто чудовими. Крім того, ні низькі фактичні підрахунки, ні низькі очікувані підрахунки не мають значення, коли р-значення визначається за допомогою моделювання.

(Для того, що це варто, я, мабуть, використовував би Pearson chi-kvadrat, тому що R має зручну функцію для тієї, яка включає в себе можливість імітації p-значення.)


яка функція в R?
llewmills

@llewmills, chisq.test.
gung - Відновіть Моніку

1

Погляньте на Rfast. https://cran.r-project.org/web/packages/Rfast/index.html Відповідними командами є g2Test_univariate (data, dc) g2Test_univariate_perm (data, dc, nperm) Розрахунки надзвичайно швидко. І взагалі віддайте перевагу тесту G ^ 2, оскільки квадрат Chi є наближенням до нього.


-1

Хі-квадратний тест і G-тест зазвичай дають подібні результати. Але найважливіше тут - ви повинні вибрати один з двох тестів і дотримуватися його не тільки для згаданого тесту, але і для майбутніх тестів у ході дослідження. Це доцільно, оскільки якщо ви спробуєте використовувати обидва тести взаємозамінно, велика ймовірність, що ви збільшите шанс отримати помилковий позитив.


2
Які міркування, за допомогою яких стверджується, що шанс на помилковий позитив збільшується? (Якщо ви не призначені , щоб запропонувати тест вибирається шляхом посилання на фактичні імпульси - але тоді це в увазі підрахунків вибирати між ними , що це проблема, а не ідеї потенційно помінявши тести самі по собі)
Glen_b -Reinstate Моніка

2
@Glen_b Шанс отримати помилковий Позитивний, ймовірно, збільшується, якщо ми виберемо p-значення тесту, яке є більш сприятливим для наших припущень (у випадку, якщо ми спробуємо обидва тести)
little_monster
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.