Припустимо, у мене є три групи з чотирма взаємовиключними характеристиками. Я беру випадкові зразки з кожної сукупності і будую перехресну таблицю або таблицю частот для характеристик, які я вимірюю. Чи правильно я кажу, що:
Якщо я хотів би перевірити, чи існує взаємозв'язок між сукупністю та характеристиками (наприклад, чи одна популяція має більш високу частоту однієї з характеристик), я повинен провести тест на квадрат чи і побачити, чи є результат вагомим.
Якщо тест чи-квадрата є вагомим, він лише мені показує, що існує певна залежність між популяціями та характеристиками, але не те, як вони пов'язані.
Крім того, не всі характеристики повинні бути пов'язані з населенням. Наприклад, якщо різні популяції мають суттєво різний розподіл характеристик A і B, але не C і D, тест хі-квадрат може все-таки повернутися як значний.
Якщо я хотів оцінити, чи впливає чисельність конкретної характеристики на чисельність населення, то я можу провести тест на рівні пропорції (я бачив це під назвою z-тест, або як
prop.test()
вR
) саме за цією характеристикою.
Іншими словами, чи доцільно використовувати значення prop.test()
для більш точного визначення характеру взаємозв'язку між двома наборами категорій, коли тест з квадратом чі говорить, що існує значна залежність?