Який взаємозв'язок між тестом чи-ква та тестом рівних пропорцій?


52

Припустимо, у мене є три групи з чотирма взаємовиключними характеристиками. Я беру випадкові зразки з кожної сукупності і будую перехресну таблицю або таблицю частот для характеристик, які я вимірюю. Чи правильно я кажу, що:

  1. Якщо я хотів би перевірити, чи існує взаємозв'язок між сукупністю та характеристиками (наприклад, чи одна популяція має більш високу частоту однієї з характеристик), я повинен провести тест на квадрат чи і побачити, чи є результат вагомим.

  2. Якщо тест чи-квадрата є вагомим, він лише мені показує, що існує певна залежність між популяціями та характеристиками, але не те, як вони пов'язані.

  3. Крім того, не всі характеристики повинні бути пов'язані з населенням. Наприклад, якщо різні популяції мають суттєво різний розподіл характеристик A і B, але не C і D, тест хі-квадрат може все-таки повернутися як значний.

  4. Якщо я хотів оцінити, чи впливає чисельність конкретної характеристики на чисельність населення, то я можу провести тест на рівні пропорції (я бачив це під назвою z-тест, або як prop.test()в R) саме за цією характеристикою.

Іншими словами, чи доцільно використовувати значення prop.test()для більш точного визначення характеру взаємозв'язку між двома наборами категорій, коли тест з квадратом чі говорить, що існує значна залежність?


Читайте також: stats.stackexchange.com/q/173415/3277 .
ttnphns

Відповіді:


23

Дуже коротка відповідь:

Тест chi-Squared ( chisq.test()в R) порівнює спостережувані частоти в кожній категорії таблиці надзвичайних ситуацій з очікуваними частотами (обчислюється як добуток граничних частот). Він використовується для визначення того, чи є відхилення між спостережуваними та очікуваними підрахунками занадто великими, щоб віднести їх до випадковості. Відхід від незалежності легко перевірити, оглянувши залишків (спробуйте ?mosaicplotабо ?assocplot, але також подивіться на vcdпакет). Використовуйте fisher.test()для точного тесту (спираючись на гіпергеометричний розподіл).

prop.test()Функція в R дозволяє перевірити , є чи пропорції можна порівняти між групами або не відрізняються від теоретичних ймовірностей. Це називається -test, оскільки тестова статистика виглядає приблизно так:z

z=(f1-f2)p^(1-p^)(1н1+1н2)

де р = ( р 1 + р 2 ) / ( п 1 + п 2 ) , а індекси ( 1 , 2 )p^=(p1+p2)/(н1+н2)(1,2) відносяться до першої та другої рядку вашої таблиці. У двосторонній таблиці надзвичайних ситуацій, де , це повинно дати порівнянні результати зі звичайнимиН0:p1=p2тестом χ 2 :χ2

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

Для аналізу дискретних даних з R настійно рекомендую керівництво R (і S-PLUS) для супроводу категоричного аналізу даних Agresti (2002) від Лаури Томпсон.


2
Чи є загальна назва для тесту, який виконує prop.test ()?
Atticus29

2
"Це називається z-тестом".
russellpierce

@chl Я трохи розгублений - я подумав prop.testі chisq.testобидва використовують чі-квадрат, який би пояснив однакові значення p, а також чому в цій публікації на R-Bloggers вони мають свою спеціальну функцію.
Антоні Пареллада

@Antoni Так, Кіт пояснив це у своїй відповіді.
chl

3
н1н2f1f2p1p2

23

zp значення з обома тестами.)

α

α

Найпотужніший тест на рівність пропорцій називається тестом Барнарда на перевагу .


@gung Я трохи розгублений - я подумав prop.testі chisq.testобидва використовують чі-квадрат, який би пояснив однакові значення p, а також чому в цій публікації на R-Bloggers вони мають свою спеціальну функцію.
Антоні Пареллада

Я не розумію, що тебе бентежить, @AntoniParellada. У цій відповіді зазначено, що вони "абсолютно однакові", що має сенс, якщо "обидва використовують чі-квадрат".
gung - Відновіть Моніку

@gung в оригінальній відповіді chl зазначає, що prop.test()... позначається як z-тест в протиріччя з chisq.test(). Пізніше Кіт каже: "Тест на квадрат-чі на рівність двох пропорцій - це те саме, що z-тест. (Ось чому @chl отримує абсолютно однакове p-значення при обох тестах)"
Антоні Пареллада

1
Це, здається, є просто нечестивою фразою, @AntoniParellada. Концептуально два тести відрізняються, про що я говорив у своїй іншій відповіді, яку ви бачили. Але математично вони рівноцінні. Насправді, я вважаю, що функція R prop.test()насправді просто називає chisq.test()та друкує вихід по-різному.
gung - Відновіть Моніку

@gung Я працював над функцією, подібною до R-Bloggers, і я збирався створити пост для людей на рівні мого початківця, цитуючи вас фактично щодо кількох ключових понять, які ви написали, пробігаючи математику і для чі квадрат і z-тест, а потім надання коду R.
Антоні Пареллада
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.