Я взагалі буду базувати свою відповідь і вставляти коментарі щодо того, як ваша проблема вписується в рамки тестування. Загалом ми можемо перевірити рівність пропорцій, використовуючи aχ2 тест, де типова нульова гіпотеза, H0, є наступним:
H0:p1=p2=...=pk
тобто всі пропорції рівні одна одній. Тепер у вашому випадку нульовою гіпотезою є наступне:
H0:p1=p2=p3
і альтернативна гіпотеза є
HA: at leat one pi is different for i=1,2,3
Тепер для того, щоб виконати χ2 тесту нам потрібно обчислити таку статистику тесту: Значення тестової статистики є
χ2=∑i=1n(Oi−Ei)2Ei
де
- χ2 = Кумулятивна статистика Пірсона, яка асимптотично наближається до a χ2 розповсюдження
- Oi = спостережувана частота
- Ei = очікувана (теоретична) частота, що стверджується нульовою гіпотезою
- n = кількість комірок у таблиці
У вашому випадку n=6 оскільки ми можемо вважати цю проблему такою таблицею:
Тепер, коли ми маємо статистику тесту, у нас є два варіанти, як продовжити тестування гіпотез.
Варіант 1) Ми можемо порівняти нашу тестову статикуχ2до відповідного критичного значення під нульовою гіпотезою. Тобто, якщоH0 правда, то а χ2 статистичні дані з таблиці непередбачених ситуацій з R рядки та C стовпці повинні мати χ2 розповсюдження с (R−1)×(C−1)ступенів свободи. Після розрахунку нашого критичного значенняχ∗ якщо ми маємо це χ2>χ∗тоді ми відкинемо нульову гіпотезу. Очевидно, що якщоχ2≤χ∗ то ми не можемо відкинути нульову гіпотезу.
Графічно (всі числа складаються) це наступне:
З графіка, якщо наша тестова статистика χ2 відповідають синій статистиці тесту, тоді ми не зможемо відкинути нульову гіпотезу, оскільки ця тестова статистика не потрапляє у критичну область (тобто, χ2<χ∗). Крім того, статистика зеленого тесту потрапляє у критичну область, і тому ми би відкинули нульову гіпотезу, якби обчислили статистику зеленого тесту.
У вашому прикладі ваші ступені свободи рівні
df=(R−1)×(C−1)=(2−1)×(3−1)=1×2=2
Варіант 2) ми можемо обчислити значення р, пов'язане з тестовою статистикою під нульовою гіпотезою, і якщо це значення p менше, ніж деяке вказанеα-рівень, тоді ми можемо відкинути нульову гіпотезу. Якщо р-значення більше, ніжα-рівень, тоді ми не можемо відкинути нульову гіпотезу. Зауважте, що значення р - це ймовірність того, що aχ2(R−1)×(C−1) розподіл більше, ніж тестова статистика.
Графічно ми це маємо
де р-значення обчислюється як площа, яка більша, ніж наша тестова статистика (синя затінена область у прикладі).
Отже, якщо α>p-value то не вдасться відкинути нульову гіпотезу H0, інше,
якщо α≤p-value відкинути нульову гіпотезу H0