Чому в статистичній літературі не наголошується на помилках типу II?


10

Я бачив багато випадків, коли помилки типу I обліковуються (позначаються альфа-значенням) у різних наукових статтях. Я рідко зустрічав, що дослідник враховує потужність або помилку типу II.

Помилки типу II можуть бути великою справою? Ми випадково відкинули альтернативну гіпотезу, коли вона була насправді помилковою. Чому значення альфа так наголошуються замість значень бета-версії?

Коли я брав статистику за перший рік, мене ніколи не навчали бета - лише альфа. Я вважаю, що до цих двох помилок слід ставитися однаково. І все-таки, здається, підкреслюється лише альфа.


1
+1 Причина полягає в тому, що традиційно помилка типу I (ака, або рівень значущості ) спочатку фіксується, а потім тест будується таким чином, щоб мінімізувати помилку типу II (рівнозначно, наприклад, щоб максимізувати потужність). Корисною статтею про wikipedia, щоб зрозуміти проблему, є тест про тести Uniformly Most Powerful (UMP), en.wikipedia.org/wiki/Uniformly_most_powerful_testα
Jeremias K

3
Ви помиляєтесь у тому, що "ми прийняли нульову гіпотезу" - ми її ніколи не приймаємо. Ми або "відхиляємо null hyp", або "не відхиляємо null hyp", але ніколи не приймаємо null hyp!
печерний чоловік

вибухнув - що пробігло повз мене. Дякуємо, що вказали на це.

1
Будьте обережні, щоб не плутати власний досвід з усією сферою статистичної літератури; Ви навряд чи зможете зробити висновок про зміст прочитаного вами матеріалу.
Glen_b -Встановити Моніку

@glen прямо увімкнено. Ефектна назва отримує більше відгуків.

Відповіді:


5

Це гарне запитання. Дозвольте почати з декількох уточнень:


Я думаю, ви праві, на жаль, менше уваги приділяєте помилкам живлення та типу II. Хоча я думаю, що ситуація покращується в галузі біомедичних досліджень (наприклад, фінансуючі агенції та IRB зараз часто вимагають аналізу потужності), я думаю, що для цього є кілька причин:

  1. Я думаю, що владу важче зрозуміти людям, ніж просто значення. (Частково це відбувається тому, що це залежить від безлічі невідомих - зокрема, від розміру ефекту, але є й інші).
  2. 0
  3. Вчені традиційно припускають, що помилки типу I гірші, ніж помилки II типу.

1
Як завжди, просвітлювальна - особливо це стосується нематематизованих :-) ... Я люблю це формулювання ... Цікаво, чи можете ви трохи розширитись на третій пункт ... Чи є підстава для цього упередження. Я знаю, що це правда, але чому ви вважаєте, що це так ... Це тому, що мова йде про трофей p-значення, і нічого іншого не має значення?
Антоні Пареллада

Дякую, @AntoniParellada. Я подумаю, що ще можу додати.
gung - Відновіть Моніку

2
Я б уточнив пункт 3) чому вчені вважають, що помилки I типу гірші. Нульова гіпотеза, як правило, є якоюсь "статус-кво", наприклад, ефект цього абсолютно нового препарату дорівнює 0. Нам подобається статус-кво, і тягар доказування лежить на досліднику доводити інше. Таким чином, ми хочемо обмежити помилку типу I, тобто ми помилково відхиляємо статус-кво. ІМО, ця прихильність до статусу кво просто філософська. Якщо ви хочете змінити мою думку, вам доведеться це довести.
Гейзенберг

1
На практиці можна було легко придумати випадки, коли помилка типу II має значення набагато більше, тобто вартість не відхилення нуля висока. Наприклад, якщо людство стикається з епідемією зомбі, я впевнений, що таке ставлення буде "спробувати будь-який наркотик, навіть якщо він може не працювати", а не "ви повинні довести, що він працює, перш ніж ми його вживати".
Гейзенберг

Додавання до @Heisenberg: У випадках, коли помилки типу II мають найбільше значення, слід розглянути можливість переходу між тестовими тестами гіпотези та тестом на еквівалентність. У вашому прикладі вам доведеться довести, що запропонований соус з вустер принаймні не погіршує епідемії зомбі. Потім показники помилок змінюють свою роль, і найважливіший показник помилок знову фіксується дизайном. Крім того, якщо у вас є якась оцінка вартості неправильних рішень, слід врахувати правило рішення, яке мінімізує ризик і не обов'язково фіксує певний рівень помилок типу I.
Хорст Грюнбуш

2

Причина в тому, що ми просто не знаємо фактичного рівня помилок типу II, і ми ніколи цього не будемо. Це залежить від параметра, який ми зазвичай не знаємо. У свою чергу, якби ми знали цей параметр, нам не потрібно було б робити статистичне тестування.

Однак, ми можемо спланувати експеримент таким чином, щоб певний рівень помилок типу II був дотриманий, надаючи певну альтернативу, що відповідає дійсності. Таким чином, ми обираємо вибірковий розмір, який не витрачає ресурси: або тому, що тест в кінці не відкидає, або тому, що вже набагато менший розмір вибірки був би достатнім для відхилення гіпотези.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.