Чи завжди чи-квадрат є однобічним тестом?


48

Опублікована стаття ( pdf ) містить ці 2 пропозиції:

Більше того, неправильне звітування може бути спричинене застосуванням неправильних правил або недостатнім знанням статистичного тесту. Наприклад, загальний df в ANOVA може вважатися помилкою df у звіті про тест , або дослідник може розділити повідомлене значення p тесту або на два, щоб отримати однобічне значення , тоді як значення тесту або вже є однобічним тестом.χ 2 F p p χ 2 FFχ2Fppχ2F

Чому вони могли це сказати? Тест хі-квадрата - це двосторонній тест. (Я запитав одного з авторів, але відповіді не отримав.)

Я щось переглядаю?


Подивіться на вправу 4.14 видання «Економетрична теорія та методи» Девідсона та Макіннона 2004 року (винятковий) приклад, коли Chi-квадрат використовується для тесту з двома хвостами. Редагувати: чудове пояснення тут: itl.nist.gov/div898/handbook/eda/section3/eda358.htm
Макс

Відповіді:


50

Тест хі-квадрата по суті завжди є однобічним тестом . Ось нескінченний спосіб подумати над цим: тест з квадратом в основному є тестом на користь. Іноді це прямо називають таким, але навіть коли це не так, це все-таки часто по суті є користю. Наприклад, тест на чі-квадрат незалежності на частотній таблиці 2 х 2 є (свого роду) випробуванням на придатність першого рядка (стовпця) до розподілу, визначеного другим рядком (стовпцем), і навпаки , одночасно. Таким чином, коли реалізоване значення чи-квадрата виходить на правий хвіст його розподілу, воно вказує на погану відповідність, і якщо воно досить далеко, відносно якогось заздалегідь заданого порогу, ми можемо зробити висновок, що воно настільки погано, що ми не віримо, що дані походять із цього довідкового розподілу.

Якби ми використовували тест чи-квадрата як двосторонній тест, ми також би переживали, якби статистика була занадто далеко в лівій частині розподілу chi-квадрата. Це означає, що ми побоюємось, що придатність може бути надто хорошою . Це, звичайно, не те, про що ми зазвичай хвилюємося. (Як історична сторона, це пов’язано з суперечкою того, чи підробляв Мендель свої дані. Ідея полягала в тому, що його дані були занадто гарними, щоб бути правдивими. Для отримання додаткової інформації див. Тут, якщо вам цікаво.)


9
+1 для згадування про двостороннє використання з експериментами з горохом Менделя: це запам'ятовується і потрапляє в основу питання.
whuber

2
+1 за гарне запитання та відмінну відповідь. @Joel W: Я настійно рекомендую відео Khan Academys на тесті χ2
Макс Гордон

9
χ2

5
Підтримка двосхилого виду: "Ймовірність з двома хвостиками, що перевищує +/- z для стандартного нормального розподілу, дорівнює правильній хвостовій ймовірності вище z-квадрата для розподілу chi-квадрата з df = 1. Наприклад, дво- стандартна нормальна ймовірність .05, яка опускається нижче -1,96 і вище 1,96, дорівнює правої хвостової імовірності чи-квадрата вище (1,96) у квадраті = 3,84, коли df = 1. " Agresti, 2007 (2-е видання), сторінка 11
Joel W.

5
Це вірно. Шкірлива z-оцінка дає змінну chi-квадрата. Наприклад, az 2 (або, -2!), Коли квадрат дорівнює 4, відповідне значення chi-квадрата. Двохвосте p-значення, пов'язане з z-балом 2, становить 0,450050026; і однохвосте p-значення, пов'язане зі значенням chi-квадрата 4 (df = 1), становить .04550026. Тест з двома хвостами відповідає тесту з однохвостим чи-квадратом. Якщо дивитись на лівий хвіст розподілу chi-квадрата, це відповідало б пошуку z-балів, які ближче до z = 0, ніж ви могли очікувати випадково.
gung - Відновити Моніку

12

Чи завжди чи-квадрат є однобічним тестом?

Це дійсно залежить від двох речей:

  1. (OE)2E

  2. π1π2|T||T|

Що означає, ми повинні бути дуже обережними щодо того, що ми маємо на увазі під тестом «квадрат-чі», і точно, що ми маємо на увазі, коли ми говоримо «однохвостий» проти «двохвостий».

У деяких обставинах (я вже згадував два; їх може бути більше), може бути доцільним називати це двохвостим, а може бути розумним називати його двохвостим, якщо ви приймаєте певну слабкість використання термінології.

Може бути розумним твердженням сказати, що це лише колись однобічний, якщо ви обмежите обговорення певними видами тестувань на квадратні чі.



Дуже дякую, що згадали про тест на дисперсію. Це насправді досить цікаве використання тесту, а також причина, чому я опинився на цій сторінці ^^
Tobbey


1

χ2

χ2

Це читання могло б переплутати те, як формувалася тестова статистика, з якими хвостами тестової статистики розглядається.


Не могли б ви детальніше зупинитися на тому, якою буде "сторона оригінальної дистрибуції"? Навіть не очевидно, на що йдеться про "оригінальний розподіл", а також про те, як це пов'язано зі статистикою хі-квадрата, як обчислюється з даних.
whuber

nχ2χ2

Гаразд, але я все одно не можу зрозуміти, з чим ти протиставляєш це. Чи можете ви надати приклад недвосторонньої статистики тесту, яка може бути використана в ANOVA, і показати, як вона пов'язана з хвостами деякого розподілу?
whuber

χ2χ2χ2

Я прошу контраст лише для того, щоб зрозуміти, що ви намагаєтесь описати. Я так і не зміг визначити, що це таке.
whuber

0

У мене також були деякі проблеми, щоб вирішити це питання, але після деяких експериментів здавалося, що моя проблема полягає просто в тому, як названі тести.

У SPSS, наприклад, таблиця 2x2 може містити додаток тесту чісквадра. Є два стовпці для p-значень, один для "Pearson Chi-Sqare", "Корекція безперервності" тощо, а інший пара стовпців для точного тесту Фішера, де є один стовпчик для двостороннього тесту і інший для a 1-бічний тест.

Я спершу подумав, що 1- і 2-х сторін позначають 1- або двосторонній варіант тесту чісквадра, який видався дивним. Однак виявилося, що це позначає основу формулювання альтернативної гіпотези в тесті різниці між пропорціями, тобто z-тест. Тож часто розумне двостороннє випробування пропорцій досягається в SPSS з тестом чисквадра, де вимірювання чісквадра порівнюється зі значенням у (однобічному) верхньому хвості розподілу. Здогадайтесь, на це вже вказували інші відповіді на оригінальне запитання, але мені знадобилося певний час, щоб зрозуміти саме це.

До речі, такий самий вид рецептури використовується і в openepi.com, і, можливо, в інших системах.




-1

χ2χ2χ2

SSwdfw

χ2

Розподіл Chi-квадрата та F


1
Тестова статистика не повинна приймати негативні значення для нас, щоб розглядати обидва хвости. Розглянемо, наприклад, тест на F для співвідношення двох дисперсій.
Glen_b

Тест F - це однобічний тест Glen_b.
Даніель

3
Тест F на рівність дисперсій, який має статистику, що співвідношення двох оцінок дисперсії НЕ є однобічним; є наближення до нього, яке розміщує більший з двох варіантів вибірки на чисельнику, але це дійсно правильно, якщо df однакові. Але якщо вам це не подобається, є будь-яка кількість інших прикладів. Статистика для тесту на суму рангів не може бути негативною, але тест є двома хвостами. Я можу надати інші приклади, якщо потрібно.
Glen_b

σ12σ22σ12>σ22
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.