@jbowman дав вам хороший варіант. Я подумав, що я можу надати деяку інформацію стосовно ваших чітких питань щодо відповідності -test порівняно з тестом . χ 2zχ2
z -test:
Існує два занепокоєння щодо доцільності використання -test, обидва щодо того, чи є правильний припущений розподіл вибірки. По-перше, -test використовує звичайний розподіл замість -розподілу, маючи на увазі, що стандартні відхилення відомі без помилки вибірки. По-друге, розподіл вибірки є безперервним, але дані дискретні; Оскільки можливі лише певні комбінації даних, можливі лише певні отримані в результаті реалізовані статистичні значення тесту, які можуть не повністю відповідати теоретичному розподілу вибірки. (Я обговорюю це питання в контексті інших тестів тут: Порівняння та порівняння, p-значення, рівні значущості та помилка типу I. ) z tzzt
Розглянемо перше занепокоєння в іншому контексті. Якщо у вас є дві групи з нормально розподіленими даними, і ви хочете побачити, чи засоби рівноцінні, вам потрібно обчислити як засоби, так і стандартні відхилення. Тепер ми знаємо, що засоби підлягають помилці вибірки, тому нам потрібно зробити тест, а не просто сказати, що ці два вибіркові засоби не однакові. Однак наші оцінки стандартних відхилень також повинні піддаватися помилці вибірки, і ми повинні якось враховувати цей факт. Коли ми це робимо, виявляється, що тестова статистика (різновид масштабованої середньої різниці) розподіляється як . Якщо ми замість цього використали звичайний розподіл (тобтоz ztz-тест), це означало б, що ми припускаємо, що наші оцінки стандартних відхилень без помилок - ідеальні. То чому б -test можна використовувати у вашому випадку? Причина полягає в тому, що ваші дані є двочленними (тобто числом «успіхів» із відомого загального числа «випробувань»), а не нормальними. У двочленному розподілі стандартне відхилення є функцією середнього значення, тому після того, як ви оцінили середнє значення, додаткової невизначеності не потрібно турбуватися. Таким чином, нормальний розподіл може бути використаний як модель розподілу вибірки тестової статистики. z
Хоча використання звичайного розподілу для розуміння тривалої поведінки тестової статистики є технічно правильним, виникає інше питання. Проблема полягає в тому, що нормальний розподіл є безперервним, але, оскільки ваші дані дискретні, не всі значення теоретичного розподілу можуть бути знайдені у вашому наборі даних. (Знову ж , я обговорюю це питання значно більш детально в вище пов'язаний відповіді.) До щастя, матч між можливими результатами ваших даних і теоретичним нормальним розподілом вибірки стає краще, чим більше ваш . У вашому випадку, незалежно від справжньої основної ймовірності, у вас може бути стільки, скільки всіх успіхів або стільки ж, скільки жодного у кожній групі. Це означає, що кількість можливих комбінацій становить91 × 91 = 1 ,NN = 180 z91×91=1,729, що є безліч можливостей. Маючи невеликий набір даних, ви дійсно можете зіткнутися з деякими видами проблем, про які я обговорюю у своїй пов'язаній відповіді, але з вам не надто турбуватися. Я вважаю, що -test був вірним вибором для дослідників. N=180z
χ2 -тест:
Але що з ? Я думаю, що це також правильний вибір, але це був би не мій перший вибір. (Дозвольте мені зазначити, що другого питання, обговореного вище - невідповідність між дискретними даними та безперервним розподілом посилань - стосується так само, як до -test, як і до -test, тому існує тут немає переваги.) Проблема зχ 2 z χ 2 χ 2 z zχ2χ2zχ2-тест полягає в тому, що він не передбачає, що є щось особливе щодо підсумків стовпців щодо підсумків рядків; обидва трактуються так, ніби вони могли бути іншими можливими значеннями. Однак це не відображає точно встановлення експерименту. Налічувалося 180 осіб, і 90 було призначено до кожної групи. Єдине, що дійсно відрізнятиметься від повторних однакових досліджень, - це кількість людей, які застудилися в кожній групі. -TEST неправильно трактує як кількість застуд і кількість людей в кожній групі , як якщо б вони могли змінюватися, але -test робить правильне припущення. Тому -test має тут більше потужності. χ2zz
Для чого це варто, тест перестановки, запропонований @jbowman, також отримує цей аспект вашого дизайнерського права і не страждає від проблеми дискретного безперервного невідповідності. Таким чином, це найкращий варіант. Але я подумав, що ви, можливо, хочете дізнатися трохи більше про те, як - і -тести порівнюються у вашій ситуації. χ 2zχ2