Чи p = 5,0% суттєво?


14

Сьогодні мене запитали, чи вважається р-значення 0,05 (точно) значущим (задане альфа = 5%) чи ні. Я не знав відповіді, і Google виявив обидві відповіді: (a) результат є значущим, якщо p менше 5%, і (b) якщо p менше 5% або дорівнює 5%.

Звичайно, жоден із цих веб-сайтів нікого не цитував. Навіщо це робити - це загальновідомі відомості, і 5% - як завгодно. Але це не допоможе мені сказати студентам щось запам'ятати.

Отже, ось мої відчайдушні запитання щодо тестування гіпотез: Якщо значення р є саме альфа - чи вважаю я результат значним чи ні? І яке авторське цитування в цьому випадку?

Велике спасибі

Відповіді:


19

Залишаючи осторонь деякі практичні питання (наприклад, ступінь α довільне, наприклад), визначення рівня значущості та p-значення роблять відповідь на це питання однозначною.

Що означає, формально, правило відхилення полягає в тому, що ви відхиляєте, коли p=α .

Це дійсно має значення лише для дискретного випадку, але в цій ситуації, якщо ви не відхилите, коли , ваш рівень помилок типу I насправді не буде α !p=αα

(Що стосується мене, немає "авторитетного" цитування; вам дійсно потрібно впоратися як з Нейманом-Пірсоном, так і з фішерським підходом до тестування гіпотез, і це щось розвивалося з часом.)

Існує будь-яка кількість текстів гарної статистики, які правильно описують тестування гіпотез.

Визначення p-значення наведено правильно в першому реченні відповідної статті Вікіпедії *:

p-значення - це ймовірність отримання тестової статистики принаймні такої ж екстремальної, як та, яка насправді спостерігалася, припускаючи, що нульова гіпотеза є істинною.

* (і ні, wikipedia не є владою, я просто кажу, що це визначення правильне)

Для простоти давайте дотримуватись нульових точок; він служить для отримання точки впоперек, не замулюючи води додатковими питаннями.

Тепер рівень значущості, αp α фактично можливо **. (Як правило, так буває і те, що власне альфа буде відрізнятися від чогось приємного і круглого, як 5%.)

** Я гадаю, я обмежую свою дискусію лише чисто дискретною або чисто безперервною розподіленою статистикою тестів. У змішаному випадку ви можете зрозуміти, як застосовується моя дискретна дискусія (у ситуаціях, коли вона застосовується).

n=17α=4.904%137500217

H0p=αα

H0p=αα

p=α

p=α

Якщо ви опишете своє правило відхилення та показуєте, що (якщо припущення задоволені), він має бажаний рівень значущості, то, ймовірно, немає необхідності в посиланнях.

H0

α

(Якщо у вас є інше видання, номери сторінок можуть змінюватися, але в ній є індекс, тому ви можете шукати терміни; будьте обережні, можливо, вам доведеться переглянути списки в розділі "Тестування гіпотези" або щось подібне в індексі, щоб знайти "регіон відхилення")

Гм, спробуємо ще одну книжку з полиці. Wackerly, Mendenhall & ScheafferМатематична статистика з додатками, 5-е видання , визначає область відхилення на p412 та p-значення (те саме, що і C&B) на p431.


Дякую. Будь ласка, дозвольте мені дурне запитання "практичного користувача статистики": Де, крім Вікіпедії, я знайду це визначення та / або правило відхилення, на яке ви посилаєтесь? Я екранізував деякі статистичні книги, але проходу не знайшов. Можливо, шукаєте невірні слова ...
BurninLeo

дивіться оновлення відповіді
Glen_b -Встановіть Моніку

Ти чудовий! Звичайно, ви це знали, але іноді варто все-таки заявити. Дуже дякую!
BurninLeo

1
(+1) Дуже приємна відповідь.
chl

2

Цікаве зізнання, яке я дізнався на своєму ранньому уроці біостатистики у професора, полягає в тому, що рівень значущості 0,05 був більш досягнений консенсусом, а не золотою правдою. З тих пір я бачив літературу, яка заграє з рівнем значущості 0,05, наприклад, "наближення", як і раніше, є яскравим висновком дослідження, і я почув аргументи, що рівень значущості 0,05 може не застосовуватися до всіх галузей дослідження. Зважаючи на це, я вважав, що оцінки балів та інтервалів довіри є більш інформативними, ніж рівні значущості. Ось цікава стаття з цього питання (мені все одно).


Дякуємо за посилання @ user2300643. І дякуємо, що уникаєте фінансового бар'єру для доступу!
подв.номери

Там цікава дискусія про походження 5% рівня значущості і т.д. тут .
Glen_b -Встановіть Моніку

0

Значення р зазвичай встановлюється для консенсусу, як сказано раніше (а точніше лінь). Щоб насправді можна було сказати, що щось важливе, ми повинні знайти значення p, яке відповідає розміру ефекту, розміру вибірки та наскільки жорстким ви хочете, щоб воно було для ваших даних. Це називається аналіз потужності (це підполе в межах статистики). Багато людей або не усвідомлюють це, або просто не користуються ним, оскільки це не просто. Це не означає, що це добре, як є. Ми завжди повинні проводити подібне дослідження, щоб зробити висновки, які є дійсно значимими.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.