Як вказати нульову гіпотезу при тестуванні гіпотез


15

Яке хороше правило, як вибрати питання для нульової гіпотези. Наприклад, якщо я хочу перевірити, чи справжня гіпотеза B, чи слід використовувати B як нуль, B як альтернативну гіпотезу, або НЕ B як нуль? Сподіваюся, питання зрозуміле. Я знаю, що це має щось спільне з помилкою, яку я хочу мінімізувати (тип I?), Але я постійно забуваю, як це відбувається, тому що я не будую для цього чіткої інтуїції. Спасибі.


Хлопці ... чудові відгуки. Всі корисні. Мене все ще дивує, коли я отримую такий рівень співпраці в Інтернеті, просто тому, що люди зацікавлені. вау ... спасибі!
Нестор

Відповіді:


17

Основним правилом хорошого мого радника було встановити нульову гіпотезу на той результат, який ви не хочете бути правдивим, тобто результат, прямий протилежний ви хочете показати.

Основний приклад. Припустимо, ви розробили нове медикаментозне лікування і хочете показати, що воно справді краще, ніж плацебо. Отже, ви встановили Null-Hypothesis новий тремент дорівнює або гірший, ніж плацебо, а Альтернативна гіпотеза H 1 : = нове лікування краще, ніж плацебо.H0:=H1:=

Це тому, що під час статистичного тестування ви або відкидаєте нульову гіпотезу (і надаєте перевагу альтернативній гіпотезі), або не можете її відхилити. Оскільки ваша "мета" - відхилити нульову гіпотезу, ви встановите її до результату, ви не хочете, щоб це було правдою.

Побічна примітка: Я знаю, що не слід встановлювати статистичний тест, щоб скрутити його і розірвати, поки не буде відкинута Нуль-Гіпотеза, випадкова мова використовувалася лише для полегшення запам'ятовування цього правила.

Це також може бути корисним: Яке значення p значень та t значень у статистичних тестах? та / або Що є хорошим вступом до тестування статистичної гіпотези для вчених-комп'ютерів?


6

Якщо гіпотеза B є цікавою гіпотезою, ви можете прийняти не-B як нульову гіпотезу, а під нулем керуйте ймовірність помилки I типу для неправильного відхилення не-B на рівні . Відхилення не-B потім тлумачиться як доказ на користь B, оскільки ми контролюємо помилку типу I, отже, навряд чи не-B є правдою. Плутати ...? α

Візьмемо приклад лікування проти відсутності лікування у двох групах з популяції. Цікава гіпотеза полягає в тому, що лікування має ефект, тобто є різниця між лікуваною групою та нелікованою групою завдяки лікуванню. Нульова гіпотеза полягає в тому, що різниці немає , і ми контролюємо ймовірність неправильно відкинути цю гіпотезу. Таким чином ми контролюємо ймовірність помилкового висновку про те, що ефект лікування є, коли ефекту від лікування немає. Помилка II типу - це ймовірність неправильного прийняття нуля, коли є ефект лікування.

Викладене вище формулювання базується на рамках Неймана-Пірсона для статистичного тестування, де статистичне тестування розглядається як проблема вирішення між випадками, нульовими та альтернативними. Рівень - частка разів, коли ми робимо помилку типу I, якщо ми (незалежно) повторили тест. У цьому контексті насправді немає жодного формального розмежування між нульовим та альтернативним. Якщо ми обмінюємо нульові та альтернативні, ми обмінюємо ймовірність помилок I та II типу. Однак ми не контролювали вище ймовірність помилок типу II (це залежить від того, наскільки великий ефект лікування), і завдяки цій асиметрії, ми можемо вважати за краще сказати, що ми не можемо відкинутиαнульова гіпотеза (замість цього ми приймаємо нульову гіпотезу). Таким чином, ми повинні бути обережними щодо висновку, що нульова гіпотеза є вірною лише тому, що ми не можемо її відкинути.

У рамках тестування значень фішерської реальності існує лише нульова гіпотеза, і один обчислює під нулем -значення для спостережуваних даних. Менші р-значення трактуються як сильніші докази проти нуля. Тут нульова гіпотеза, безумовно, не-B (відсутність ефекту від лікування), а р -значення трактується як кількість доказів проти нуля. З невеликим р- значенням ми можемо впевнено відкинути нуль, що немає ефекту лікування, і зробити висновок, що існує ефект лікування. У цьому рамках ми можемо лише відхилити або не відхилити (ніколи не прийняти) нуль, і все стосується фальсифікації нуля. Зауважимо, що пppppp-цінність не потребує виправдання (уявної) повторної кількості рішень.

Жодна структура не має проблем, і термінологія часто змішується. Я можу порекомендувати книгу Статистичні дані: парадигма вірогідності Річарда М. Ройала для чіткого розгляду різних концепцій.


5

Відповідь "частістів" полягає в тому, щоб винайти нульову гіпотезу форми "не B", а потім аргументувати "не B", як у відповіді Стеффен. Це логічний еквівалент висунення аргументу "Ви помиляєтесь, тому я маю рацію". Це такий спосіб міркування використання політиком (тобто інша сторона погана, тому ми хороші). Досить важко розібратися з більш ніж однією альтернативою в рамках такого роду міркувань. Це тому, що аргумент "ви неправі, тому я маю рацію" має сенс лише тоді, коли обидва не можуть помилитися, що, безумовно, може статися, коли існує більше однієї альтернативної гіпотези.

Відповідь "Баєса" - це просто обчислити ймовірність гіпотези, яка вас зацікавила у тестуванні, залежно від будь-яких наявних у вас доказів. Завжди це містить попередню інформацію, яка є просто припущеннями, які ви зробили для того, щоб ваша проблема була добре поставлена ​​(всі статистичні процедури покладаються на попередню інформацію, байєсівські - просто роблять їх більш чіткими). Він, як правило, складається з деяких даних, і ми маємо теорему Байєса

P(H0|DI)=P(H0|I)P(D|H0I)kP(Hk|I)P(D|HkI)

Ця форма не залежить від того, що називається "нульовим" і того, що називається "альтернативним", тому що для кожної гіпотези, яку ви збираєтеся врахувати, ви повинні обчислити абсолютно однакові величини - попереднього та ймовірного. Це в певному сенсі аналогічно для обчислення показників помилок "тип 1" і "тип 2" при тестуванні гіпотези Неймана Пірсона, просто тому, що коефіцієнт помилок "типу 2" при H0H0є "альтернативою". Тільки конотації, які мають на увазі слова "нульові" та "альтернативні", роблять їх зовнішніми. Ви можете виявити еквівалентність у випадку "леми Неймана Пірсона", коли є дві гіпотези, оскільки це просто коефіцієнт вірогідності, який дається одразу, беручи шанси вищезгаданої теореми Байєса:

P(H0|DI)P(H1|DI)=P(H0|I)P(H1|I)×P(D|H0I)P(D|H1I)=P(H0|I)P(H1|I)×Λ

H0Λ>Λ~Λ~H1 деL1- "втрата помилки 1 типу", аL2- "втрата помилки типу 2". Це втрати, а не ймовірності, які описують відносну серйозність допущення кожної з двох помилок. Критерієм частотистів є мінімізація однієї із середніх показників помилок типу 1 або 2, зберігаючи іншу фіксовану. Але оскільки вони призводять до однієї форми межі прийняття рішення, ми завжди можемо знайти еквівалентний байєсівський коефіцієнт попередніх * втрат для кожного частолістського мінімізованого рівня помилок.L2L1L1L2

Λ1<Λ~1


3
Цей перший параграф є пародією на класичний підхід до тестування гіпотез.
whuber

Тестування гіпотез - це не завжди питання прийняття рішення. Він часто формулюється як такий, але в науці питання може полягати в тому, щоб задокументувати, що нуль неправдивий і на скільки. Я розглядаю гру, що грає в слова, як нагадування про цю мету. З цієї точки зору, відмова відхилення - це не рішення про прийняття, а відсутність у даних даних про відхилення.
NRH

@NRH - Я згоден, але це не завжди є метою. Якщо ви хочете перевірити нову теорію, ви хочете дізнатися, наскільки це правда, так само, як ви хочете дізнатися, наскільки це неправдиво. І хоча тест гіпотези не завжди безпосередньо призводить до рішення, здається, марно витрачати час на тестування його, якщо це врешті-решт не призведе до рішення. Насправді ви вже формулюєте рішення у своєму коментарі: "дійте так, ніби нуль неправдивий". Для цього є лише одна альтернатива: "дійте так, ніби справжня нуль". Якщо існує більше однієї альтернативи, то гіпотеза ...
ймовірністьлогічна

(продовження) .. тест не був чітко визначений і є "математично недобрим", так би мовити. У цьому рішенні може бути велика невизначеність, але інших альтернатив немає, нуль не може бути неправдивим і неправдивим одночасно, якщо у вас не виникає неправомірна / неоднозначна проблема. Але в цьому випадку тестування гіпотез безглуздо - належного висновку не може бути.
ймовірністьлогічний

(продовження сказу) - і якщо мета - просто кількісно оцінити докази проти нуля, то вам не потрібно тест на гіпотезу. Це те, для чого р-значення - вам не потрібно приймати чи відхиляти, просто повідомте про його значення.
ймовірністьлогічний

1

Нульова гіпотеза, як правило, передбачає, що відмінності змінної відповіді пов'язані лише з помилкою.

AxH0Ax

Якщо не відхилити цю нульову гіпотезу, трактується як:

1) будь-які відмінності xвнаслідок однієї помилки, а не, Aабо

2) що дані недостатні для виявлення різниці, навіть якщо така існує (див. Помилку типу 2 нижче).

HaAx

H0AxH0Ax


1
Третій абзац, мабуть, означає, що, якщо відхилити нуль означає, що нуль є істинним, але явно це неправильно: альтернатива може бути істинною (і, як правило, є), але не відрізняється достатньо від нуля, який повинен бути виявлений за даними даними.
whuber

@whuber - хороший момент, я відредагую відповідь, щоб це відобразити
DQdlM
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.