Вибір між -test та -test


20

Передумови: я викладаю колегам, які працюють на тестуванні гіпотез, і розумію більшу частину цього чудово, але є один аспект, який я зав’язую у вузли, намагаючись зрозуміти, а також пояснюю іншим.

Це я думаю, що знаю (будь ласка, виправте, якщо не так!)

  • Статистика, яка була б нормальною, якби відома дисперсія, слідкуйте за -розподілом, якщо дисперсія невідомаt
  • CLT (центральна гранична теорема): розподіл вибірки середнього зразка приблизно нормальний для досить великих (може бути , може бути до для сильно перекошених розподілів)30 300n30300
  • -розподіл можна вважати нормальним для ступенів свободи> 30t>30

Ви використовуєте -test, якщо:z

  1. Норма популяції та відома дисперсія (для будь-якого розміру вибірки)
  2. Населення нормальне, дисперсія невідома і (завдяки CLT)n>30
  3. Населення двочленове, ,n q > 10np>10nq>10

Ви використовуєте -test, якщо:t

  1. Населення нормальне, дисперсія невідома іn<30
  2. Немає знань про популяцію чи дисперсію та , але вибіркові дані виглядають нормально / проходять тести тощо, тому популяція може вважатися нормальноюn<30

Тож мені залишається:

  • Для зразків та (?) Відсутні відомості про популяцію та дисперсію, відомі / невідомі.< 300>30<≈300

Тому мої запитання:

  1. При якому розмірі вибірки ви можете припустити (де немає відомостей про розподіл чи дисперсію популяції), що розподіл вибірки середнього значення є нормальним (тобто CLT почав), коли розподіл вибірки виглядає ненормальним? Я знаю, що для деяких дистрибутивів потрібно , але, здається, деякі ресурси використовують -test кожного разу, коли ...z n > 30n>300zn>30

  2. Для випадків, в яких я не впевнений, я припускаю, що я переглядаю дані для нормальності. Тепер, якщо дані вибірки виглядають нормально, чи використовую я -test (оскільки вважаю популяцію нормальною, а з )?n > 30zn>30

  3. А як там, де вибіркові дані для випадків, щодо яких я не впевнений, не виглядають нормально? Чи є обставини, коли ви все-таки використовуєте -test або -test або завжди шукаєте трансформувати / використовувати непараметричні тести? Я знаю, що завдяки CLT, при деякому значенні розподіл вибірки середнього значення буде приблизним до нормального, але вибіркові дані не скажуть мені, яке це значення ; дані вибірки можуть бути ненормальними, тоді як середнє значення вибірки дорівнює нормі / . Чи бувають випадки, коли ви б трансформували / використовували непараметричний тест, коли насправді розподіл вибірки середнього значення був нормальним / але ви не могли сказати? z n n t ttznntt


4
" може бути до 300 для сильно перекошених дистрибутивів " ... в деяких випадках це може бути ще куди більше; або це ніколи не станеться. Оберіть будь-який , і я покажу вам випадок, коли його недостатньо. n
Glen_b -Встановити Моніку

Дякую Glen_b - тому завжди перевіряйте, чи вибіркові дані виглядають нормально, щоб використовувати параметричні?
Хатті

@Hatti nope! Т-тест дійсний, коли дані здаються ненормальними.
АдамО

Відповіді:


24

@AdamO вірно, ви завжди завжди використовуєте -test, якщо не знаєте стандартного відхилення населення a-priori. Вам не потрібно турбуватися про те, коли перейти на -test, тому що -розподіл 'перемикається' для вас. Більш конкретно, -розподіленого сходиться до нормалі, таким чином , це правильний розподіл для використання на кожен . tzttNN

Тут також виникає плутанина щодо значення традиційної лінії у . Про люди говорять про два типи конвергенції: N=30

  1. Перший полягає в тому, що розподіл вибірки тестової статистики (тобто ), обчислений із звичайно розподілених (всередині групи) необроблених даних, переходить до нормального розподілу як незважаючи на те, що SD оцінюється за даними. (Розподіл опікується цим для вас, як зазначено вище.) tNt
  2. Друга полягає в тому, що розподіл вибірки середнього нерозподіленого (всередині групи) вихідних даних переходить до нормального розподілу (повільніше, ніж вище), як . Люди розраховують на теорему про центральну межу, щоб піклуватися про це за них. Однак немає гарантії, що вона збіжиться в будь-якому розумному розмірі вибірки - точно не існує підстав вважати, що (або ) - це магічне число. Залежно від величини та характеру ненормальності, це може зайняти дуже багато часу (пор. @ Відповідь Макроса тут: Регресія, коли залишки OLS зазвичай не розподіляютьсяN30 300 U U t30300). Якщо ви вважаєте, що ваші (всередині групи) необроблені дані не є дуже нормальними, можливо, краще використовувати інший тип тесту, наприклад, Mann-Whitney -testU . Зауважте, що за ненормальних даних Man-Whitney -test, ймовірно, буде більш потужним, ніж -test, і може бути таким, навіть якщо CLT запустив. (Варто також зазначити, що тестування на нормальність ймовірно, що вас заблудять, див .: Чи є тестування на нормальність "по суті марним"? )Ut

У будь-якому випадку, щоб відповісти на ваші запитання більш чітко, якщо ви вважаєте, що ваші (всередині групи) необроблені дані зазвичай не поширюються, використовуйте Man-Whitney -test; якщо ви вважаєте, що дані звичайно поширюються, але ви не знаєте SD a-пріорі, використовуйте -test; і якщо ви вважаєте, що ваші дані зазвичай розповсюджуються, і ви знаєте SD a-priori, використовуйте -test. Utz

Це може допомогти вам прочитати нещодавню відповідь @ GregSnow тут: Інтерпретація p-значення при порівнянні пропорцій між двома невеликими групами R щодо цих питань.


Дякую, це було дуже корисно, я знав, що надмірно ускладнюю це, оскільки t-тест для більших n наближається до норми. Тож строго кажучи, навіть якщо n було 1000, слід використовувати t-тест, якщо SD невідомо a-priori?
Хатті

Ласкаво просимо. Строго кажучи, так , але зауважте, що буде дуже важко сказати різницю між -розподілом та нормальним розподілом у цій точці. t
gung - Відновити Моніку

Однозначно так. Вибачте, що було настільки вибагливим, що просто важко намагатися придумати, як це пояснити іншим, досить чорно-білим. Вдячний за вашу допомогу!
Хатті

Також зауважте, що підрахунок результатів t-тесту призначений для всіх намірів і цілей без значних додаткових обчислювальних витрат на сьогодні. Ми вже не шукаємо статистику тестів у деяких паперових таблицях, які не можуть охопити всі випадки, ми просто запитуємо комп’ютер. Отже, навіщо турбуватися і турбуватися про те, чи могли ви також отримати ті ж результати, використовуючи z-тест?
Бьорн

11

t

ttz

tz

zt


Використовуйте t-тест завжди для непараметричного тесту на відмінності в засобах .. ви маєте на увазі параметричний чи не так?
Xavier Bourret Sicotte
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.