Чи можна довести нульову гіпотезу?


37

Як зазначено в питанні - чи можна довести нульову гіпотезу? З мого (обмеженого) розуміння гіпотези, відповідь "ні", але я не можу придумати жорсткого пояснення для цього. Чи на це питання є остаточна відповідь?


4
Це залежить від того, що ви маєте на увазі під «довести». Як зазначалося, це філософське питання, а не статистичне та не має остаточної відповіді (хоча, принаймні з часів Девіда Юма, більшість людей відповіли б "ні").
whuber

Це дещо невірне питання. Нам потрібно знати, за яких умов має відбуватися цей «доказ».
ймовірністьлогічний

Можливо, краще поставлене питання - "За яких умов / припущень можна довести нульову гіпотезу?"
ймовірністьлогічний

Відповіді:


19

Якщо ви говорите про реальний світ, а не про формальну логіку, відповідь звичайно. "Доведення" чого-небудь емпіричним шляхом залежить від сили висновку, що в свою чергу визначається обгрунтованістю процесу тестування, який оцінюється з огляду на все, що відомо про те, як працює світ (тобто теорія). Щоразу, коли хтось приймає, що певні емпіричні результати виправдовують відкидання гіпотези "нульової", обов'язково потрібно робити такі судження (обгрунтованість дизайну; світ працює певним чином), тож маючи робити аналогічні припущення, необхідні для виправдання висновку "доказів" null "зовсім не проблематично.

То які ж аналогічні припущення? Ось приклад "доведення нуля", що є звичайним явищем в галузі охорони здоров'я та соціальних наук. (1) Визначте "нульове" чи "без ефекту" певним чином, що має значення. Скажімо, що я вважаю, що я повинен вести себе так, ніби не існує суттєвої різниці між двома методами лікування, t1 і t2, для захворювання, якщо один не дає 3% кращих шансів на одужання, ніж інші. (2) Визначте дійсну конструкцію для тестування, чи є якийсь ефект - у цьому випадку, чи є різниця у ймовірності відновлення між t1 та t2. (3) Зробіть аналіз потужності, щоб визначити, який розмір вибірки необхідний для створення достатньо високої ймовірності - той, на який я впевнено покладаюся, враховуючи те, що 'припускаючи, що вона існує. Зазвичай люди кажуть, що потужності достатньо, якщо ймовірність дотримання заданого ефекту у вказаній альфа-то становить щонайменше 0,80, але правильний рівень впевненості насправді полягає в тому, наскільки ви проти цього помиляєтесь - такий же, як це під час вибору p -пороговий поріг для "відхилення нуля". (4) Виконайте емпіричний тест і спостерігайте за ефектом. Якщо воно нижче вказаного значення "змістовна різниця" - 3% у моєму прикладі - ви "довели", що "ефекту немає".

Для гарного розгляду цього питання див. Стрейнер, DL Єдинороги чи існують: Навчальний посібник "Доведення" нульової гіпотези . Канадський журнал психіатрії 48, 756-761 (2003).


1
+1. Це хороший приклад того, як важливо бути зрозумілим щодо свого "доказу". У багатьох додатках той, на котрий ви посилаєтесь тут, стандарт "діяти так, ніби", якщо я можу це так назвати - настільки слабкий, що ніхто не сприймає це як "доказ". Я не заперечую її корисності і я прихильник такого підходу для підтримки раціонального прийняття рішень. (Але, можливо, байєсівські методи кращі ... :-)
блукання

1
(+1) Приємна відповідь. Я додав посилання на онлайн-версію статті Streiner; Сподіваюся, ви не заперечуєте (не соромтесь видаляти).
чл

1
ще кілька речей: (1) Трактувати невдачу відхилити нуль як доказ на підтвердження нуля є шокуючою поширеною помилкою та звичайним приводом для точки Стрейнера. Ця помилка, по суті, перетворює сильну неприязнь до помилки типу 1 у нормі "p <0,05" у ліцензію на введення типу 2. S каже: "зачекайте - вам потрібна сила ..." (2) Вюбер наводить відомий аргумент Юма. PT H є на насправді так само , як підривної емпіричних доказів , що відкидають нуль в якості доказів в нуль. Н каже, що індукція не може підтримувати причинно-наслідкові умовиводи. Добре; але альтернативи для емпіричного дослідження немає! Іди Перл (і Байєс), а не Юм, на причинності!
dmk38

1
це питання про тестування на еквівалентність також має кілька хороших пропозицій stats.stackexchange.com/questions/3038/…
Jeromy Anglim

Чи це еквівалент припущення "не нульового" як нової гіпотези нуля, а потім відхилення цієї нової нульової гіпотези?

16

Відповідь з математичної сторони: це можливо, якщо і лише тоді, коли "гіпотези є взаємними єдиними".

Якщо під "довести" ви маєте на увазі правило, яке може "прийняти" (чи варто це сказати :)) з імовірністю помилитися з нулем, то ви шукаєте те, що можна назвати "ідеальним тестом", і це існує:H0

Якщо ви протестуєте раніше, випадкова величина виводиться з P 0 або з P 1 (тобто тестування H 0 : X P 0 проти H 1 : X P 1 ), то існує ідеальний тест, якщо і лише тоді, коли P 1P 0 ( P 1 і P 0 є "взаємно єдиними". XP0P1H0:XP0H1:XP1 P1P0P1P0

Якщо ви не знаєте, що означає "взаємно сингулярне", я можу навести вам приклад: і U [ 3 , 4 ] (уніформа на [ 0 , 1 ] і [ 3 , 4 ] ) є взаємними однини . Це означає, що ви хочете протестуватиU[0,1]U[3,4][0,1][3,4]

проти H 1 : X U [ 3 , 4 ]H0:XU[0,1]H1:XU[3,4]

тоді існує ідеальний тест (здогадайтесь, що це таке :)): тест, який ніколи не помиляється!

Якщо іP1P0

H0H1H0H1


4
+1 Приємна відповідь. Просте відображення математики полягає в тому, що нуль та його альтернативи передбачають отримання непересічних наборів результатів; наприклад, або в цій кімнаті зебра, або немає. Звичайно, "довести" тут неявно включає "умовне за моделлю", яке саме ніколи не встановлюється з такою ж суворістю, як, скажімо, математична теорема; він неявно включає "умовну точність спостережень"; і це неявно включає, що гіпотези можна однозначно інтерпретувати. (Для критики останніх см Джорджа Лакофф Жінки, вогонь і небезпечні речі. )
whuber

11

Так, є остаточна відповідь. Ця відповідь така: Ні, немає способу довести нульову гіпотезу. Наскільки я знаю, найкраще зробити це довірчі інтервали навколо вашої оцінки та продемонструвати, що ефект настільки малий, що він може бути по суті неіснуючим.


4
Більш загальна проблема в статистиці полягає не в тому, що ви не в змозі довести нульову гіпотезу, це те, що ви не в змозі з певністю оцінити точні оцінки. Тобто, так само як ви не можете сказати "немає ефекту змінної", ви не можете сказати, що "розмір ефекту змінної становить 1,95". Статистика завжди має довірчі інтервали.
russellpierce

1
Погодилися, що відповідь - це велике "НІ" і з дуже вагомої причини: шляхом побудови статистичної гіпотези. Той факт, що прийнята відповідь стверджує інакше, абсолютно трагічний. Що тестування гіпотез дає відповідь: якщо припустити, що моя гіпотеза є правдивою , чи відповідають дані, які я вибірював, відповідати їй? І аж ніяк не навпаки. Не потрібно багато міркувань, щоб зрозуміти, що з цього не можна зробити висновок, чи справжня гіпотеза чи ні.
Крістоф

4

Для мене теоретична база прийняття рішень представляє найпростіший спосіб зрозуміти "нульову гіпотезу". В основному це говорить про те, що повинно бути принаймні дві альтернативи: нульова гіпотеза і хоча б одна альтернатива. Тоді "проблема вирішення" полягає в тому, щоб прийняти одну з альтернатив, а відкинути інші (хоча нам потрібно точно визначити, що ми маємо на увазі під "прийняттям" та "відхиленням" гіпотези). Я бачу питання "чи можна довести нульову гіпотезу?" як аналог "чи можемо ми завжди приймати правильне рішення?". З точки зору теорії рішення, відповідь однозначно - так, якщо

1) у процесі прийняття рішень немає невизначеності, оскільки тоді математична вправа розробити, яке правильне рішення.

2) ми приймаємо всі інші приміщення / припущення проблеми. Найбільш критичним (на мою думку) є те, що гіпотеза, про яку ми вирішуємо, є вичерпною, і одна (і лише одна) з них повинна бути правдивою, а інші повинні бути хибними.

З більш філософської точки зору неможливо "довести" нічого, в тому сенсі, що "доказ" повністю залежить від припущень / аксіом, які призводять до цього "доказу". Я бачу доказ як якусь логічну еквівалентність, а не «факт» чи «істину» в тому сенсі, що якщо доказ невірний, припущення, що призвели до нього, також є помилковими.

Застосовуючи це до "доведення нульової гіпотези", я можу "довести" це правдою, просто припустивши, що це правда, або припускаючи, що це правда, якщо дотримуються певні умови (наприклад, значення статистики).


3

Так, можна довести нуль - в точно такому ж сенсі, що можна довести будь-яку альтернативу нулю. У байєсівському аналізі цілком можливо, що шанси на користь нуля порівняно з будь-якою із запропонованих альтернатив йому стають довільно великими. Більше того, помилково стверджувати, як деякі з наведених відповідей стверджують, що нуль можна довести лише тоді, коли альтернативи йому неперервні (не перетинаються з нульовими). У байєсівському аналізі кожна гіпотеза має попередній розподіл ймовірностей. Цей розподіл поширює одиничну масу попередньої ймовірності над запропонованими альтернативами. Нульова гіпотеза ставить усю попередню ймовірність на єдину альтернативу. В принципі, альтернативи нулю можуть ставити всю попередню ймовірність на якусь ненульову альтернативу (на іншій "точці"), але це рідко. Взагалі, альтернативні хеджування, тобто вони поширюють ту саму масу попередньої ймовірності над іншими альтернативами - або до виключення нульової альтернативи, або, частіше, включаючи нульову альтернативу. Потім стає питанням, яка гіпотеза ставить найбільш попередню ймовірність того, куди фактично потрапляють експериментальні дані. Якщо дані щільно падають там, де нуль говорить про те, що вони повинні впасти, то це буде шанс на користь (серед запропонованих гіпотез) ТІЛЬКИ, ЩО ВІН ВКЛЮЧЕНО (ВНУТРЕННЯ В, НЕ ВЗАЄМНО ЕКСКЛЮЗИВНО) АЛЬТЕРНАТИВИ ЙОГО. Вважає, що вкладена альтернатива не є більшою ймовірністю, ніж множина, в якій вона вкладена, відображає неспроможність розрізнити вірогідність та ймовірність. Хоча неможливо, щоб складова множини була менш ймовірною, ніж уся множина, цілком можливо, що задня ймовірність складової набору гіпотез буде більшою, ніж задня ймовірність множини в цілому. Задня ймовірність гіпотези є результатом функції ймовірності та попереднього розподілу ймовірностей, який передбачає гіпотеза. Якщо гіпотеза поставить усю попередню ймовірність у потрібне місце (наприклад, на нульовому рівні), то вона матиме більш високу задню ймовірність, ніж гіпотеза, яка ставить частину попередньої ймовірності в неправильне місце (не на нуль). Задня ймовірність гіпотези є результатом функції ймовірності та попереднього розподілу ймовірностей, який передбачає гіпотеза. Якщо гіпотеза поставить усю попередню ймовірність у потрібне місце (наприклад, на нульовому рівні), то вона матиме більш високу задню ймовірність, ніж гіпотеза, яка ставить частину попередньої ймовірності в неправильне місце (не на нуль). Задня ймовірність гіпотези є результатом функції ймовірності та попереднього розподілу ймовірностей, який передбачає гіпотеза. Якщо гіпотеза поставить усю попередню ймовірність у потрібне місце (наприклад, на нульовому рівні), то вона матиме більш високу задню ймовірність, ніж гіпотеза, яка ставить частину попередньої ймовірності в неправильне місце (не на нуль).


2

Технічно ні, нульову гіпотезу неможливо довести. Для будь-якого фіксованого, кінцевого розміру вибірки завжди буде невеликий, але ненульовий розмір ефекту, для якого ваш статистичний тест практично не має сили. Однак, більш практично, ви можете довести, що ви знаходитесь в деякому невеликому епізолі нульової гіпотези, так що відхилення, менші за цей епсилон, практично не значні.


2

Є випадок, коли доказ можливий. Припустимо, у вас є школа, і ваша нулева гіпотеза полягає в тому, що кількість хлопчиків і дівчаток однакова. Зі збільшенням кількості вибірки невизначеність у співвідношенні хлопчиків і дівчаток має тенденцію до зменшення, зрештою, досягаючи визначеності (що я припускаю, ви маєте на увазі під собою доказ), коли вся вибіркова група учнів.

Але якщо у вас немає кінцевої сукупності або якщо ви беруть вибірку із заміною і не можете помітити повторно відібраних осіб, ви не можете зменшити невизначеність до нуля за допомогою кінцевої вибірки.


0

Я хотів би обговорити тут точку, що багато користувачів дещо плутаються. Яке справжнє значення твердження Нульової гіпотези H0: p = 0? Чи намагаємося ми визначити, чи параметр p дорівнює нулю? Звичайно ні, немає способу досягти такої мети.

Що ми маємо намір встановити, це те, що, зважаючи на набір даних, оцінене значення параметра не може бути помітним від нуля. Пам'ятайте, що NHST "несправедливо" щодо альтернативних гіпотез: нуль присвоюється 95% рівня довіри і лише 5% до альтернативного. Як наслідок, "несуттєвий" результат не означає, що H0 справедливий, а просто те, що ми не знайшли достатніх доказів того, що альтернатива є ймовірною.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.