Як зазначено в питанні - чи можна довести нульову гіпотезу? З мого (обмеженого) розуміння гіпотези, відповідь "ні", але я не можу придумати жорсткого пояснення для цього. Чи на це питання є остаточна відповідь?
Як зазначено в питанні - чи можна довести нульову гіпотезу? З мого (обмеженого) розуміння гіпотези, відповідь "ні", але я не можу придумати жорсткого пояснення для цього. Чи на це питання є остаточна відповідь?
Відповіді:
Якщо ви говорите про реальний світ, а не про формальну логіку, відповідь звичайно. "Доведення" чого-небудь емпіричним шляхом залежить від сили висновку, що в свою чергу визначається обгрунтованістю процесу тестування, який оцінюється з огляду на все, що відомо про те, як працює світ (тобто теорія). Щоразу, коли хтось приймає, що певні емпіричні результати виправдовують відкидання гіпотези "нульової", обов'язково потрібно робити такі судження (обгрунтованість дизайну; світ працює певним чином), тож маючи робити аналогічні припущення, необхідні для виправдання висновку "доказів" null "зовсім не проблематично.
То які ж аналогічні припущення? Ось приклад "доведення нуля", що є звичайним явищем в галузі охорони здоров'я та соціальних наук. (1) Визначте "нульове" чи "без ефекту" певним чином, що має значення. Скажімо, що я вважаю, що я повинен вести себе так, ніби не існує суттєвої різниці між двома методами лікування, t1 і t2, для захворювання, якщо один не дає 3% кращих шансів на одужання, ніж інші. (2) Визначте дійсну конструкцію для тестування, чи є якийсь ефект - у цьому випадку, чи є різниця у ймовірності відновлення між t1 та t2. (3) Зробіть аналіз потужності, щоб визначити, який розмір вибірки необхідний для створення достатньо високої ймовірності - той, на який я впевнено покладаюся, враховуючи те, що 'припускаючи, що вона існує. Зазвичай люди кажуть, що потужності достатньо, якщо ймовірність дотримання заданого ефекту у вказаній альфа-то становить щонайменше 0,80, але правильний рівень впевненості насправді полягає в тому, наскільки ви проти цього помиляєтесь - такий же, як це під час вибору p -пороговий поріг для "відхилення нуля". (4) Виконайте емпіричний тест і спостерігайте за ефектом. Якщо воно нижче вказаного значення "змістовна різниця" - 3% у моєму прикладі - ви "довели", що "ефекту немає".
Для гарного розгляду цього питання див. Стрейнер, DL Єдинороги чи існують: Навчальний посібник "Доведення" нульової гіпотези . Канадський журнал психіатрії 48, 756-761 (2003).
Відповідь з математичної сторони: це можливо, якщо і лише тоді, коли "гіпотези є взаємними єдиними".
Якщо під "довести" ви маєте на увазі правило, яке може "прийняти" (чи варто це сказати :)) з імовірністю помилитися з нулем, то ви шукаєте те, що можна назвати "ідеальним тестом", і це існує:
Якщо ви протестуєте раніше, випадкова величина виводиться з P 0 або з P 1 (тобто тестування H 0 : X ⇝ P 0 проти H 1 : X ⇝ P 1 ), то існує ідеальний тест, якщо і лише тоді, коли P 1 ⊥ P 0 ( P 1 і P 0 є "взаємно єдиними".
Якщо ви не знаєте, що означає "взаємно сингулярне", я можу навести вам приклад: і U [ 3 , 4 ] (уніформа на [ 0 , 1 ] і [ 3 , 4 ] ) є взаємними однини . Це означає, що ви хочете протестувати
проти H 1 : X ⇝ U [ 3 , 4 ]
тоді існує ідеальний тест (здогадайтесь, що це таке :)): тест, який ніколи не помиляється!
Якщо і
Так, є остаточна відповідь. Ця відповідь така: Ні, немає способу довести нульову гіпотезу. Наскільки я знаю, найкраще зробити це довірчі інтервали навколо вашої оцінки та продемонструвати, що ефект настільки малий, що він може бути по суті неіснуючим.
Для мене теоретична база прийняття рішень представляє найпростіший спосіб зрозуміти "нульову гіпотезу". В основному це говорить про те, що повинно бути принаймні дві альтернативи: нульова гіпотеза і хоча б одна альтернатива. Тоді "проблема вирішення" полягає в тому, щоб прийняти одну з альтернатив, а відкинути інші (хоча нам потрібно точно визначити, що ми маємо на увазі під "прийняттям" та "відхиленням" гіпотези). Я бачу питання "чи можна довести нульову гіпотезу?" як аналог "чи можемо ми завжди приймати правильне рішення?". З точки зору теорії рішення, відповідь однозначно - так, якщо
1) у процесі прийняття рішень немає невизначеності, оскільки тоді математична вправа розробити, яке правильне рішення.
2) ми приймаємо всі інші приміщення / припущення проблеми. Найбільш критичним (на мою думку) є те, що гіпотеза, про яку ми вирішуємо, є вичерпною, і одна (і лише одна) з них повинна бути правдивою, а інші повинні бути хибними.
З більш філософської точки зору неможливо "довести" нічого, в тому сенсі, що "доказ" повністю залежить від припущень / аксіом, які призводять до цього "доказу". Я бачу доказ як якусь логічну еквівалентність, а не «факт» чи «істину» в тому сенсі, що якщо доказ невірний, припущення, що призвели до нього, також є помилковими.
Застосовуючи це до "доведення нульової гіпотези", я можу "довести" це правдою, просто припустивши, що це правда, або припускаючи, що це правда, якщо дотримуються певні умови (наприклад, значення статистики).
Так, можна довести нуль - в точно такому ж сенсі, що можна довести будь-яку альтернативу нулю. У байєсівському аналізі цілком можливо, що шанси на користь нуля порівняно з будь-якою із запропонованих альтернатив йому стають довільно великими. Більше того, помилково стверджувати, як деякі з наведених відповідей стверджують, що нуль можна довести лише тоді, коли альтернативи йому неперервні (не перетинаються з нульовими). У байєсівському аналізі кожна гіпотеза має попередній розподіл ймовірностей. Цей розподіл поширює одиничну масу попередньої ймовірності над запропонованими альтернативами. Нульова гіпотеза ставить усю попередню ймовірність на єдину альтернативу. В принципі, альтернативи нулю можуть ставити всю попередню ймовірність на якусь ненульову альтернативу (на іншій "точці"), але це рідко. Взагалі, альтернативні хеджування, тобто вони поширюють ту саму масу попередньої ймовірності над іншими альтернативами - або до виключення нульової альтернативи, або, частіше, включаючи нульову альтернативу. Потім стає питанням, яка гіпотеза ставить найбільш попередню ймовірність того, куди фактично потрапляють експериментальні дані. Якщо дані щільно падають там, де нуль говорить про те, що вони повинні впасти, то це буде шанс на користь (серед запропонованих гіпотез) ТІЛЬКИ, ЩО ВІН ВКЛЮЧЕНО (ВНУТРЕННЯ В, НЕ ВЗАЄМНО ЕКСКЛЮЗИВНО) АЛЬТЕРНАТИВИ ЙОГО. Вважає, що вкладена альтернатива не є більшою ймовірністю, ніж множина, в якій вона вкладена, відображає неспроможність розрізнити вірогідність та ймовірність. Хоча неможливо, щоб складова множини була менш ймовірною, ніж уся множина, цілком можливо, що задня ймовірність складової набору гіпотез буде більшою, ніж задня ймовірність множини в цілому. Задня ймовірність гіпотези є результатом функції ймовірності та попереднього розподілу ймовірностей, який передбачає гіпотеза. Якщо гіпотеза поставить усю попередню ймовірність у потрібне місце (наприклад, на нульовому рівні), то вона матиме більш високу задню ймовірність, ніж гіпотеза, яка ставить частину попередньої ймовірності в неправильне місце (не на нуль). Задня ймовірність гіпотези є результатом функції ймовірності та попереднього розподілу ймовірностей, який передбачає гіпотеза. Якщо гіпотеза поставить усю попередню ймовірність у потрібне місце (наприклад, на нульовому рівні), то вона матиме більш високу задню ймовірність, ніж гіпотеза, яка ставить частину попередньої ймовірності в неправильне місце (не на нуль). Задня ймовірність гіпотези є результатом функції ймовірності та попереднього розподілу ймовірностей, який передбачає гіпотеза. Якщо гіпотеза поставить усю попередню ймовірність у потрібне місце (наприклад, на нульовому рівні), то вона матиме більш високу задню ймовірність, ніж гіпотеза, яка ставить частину попередньої ймовірності в неправильне місце (не на нуль).
Технічно ні, нульову гіпотезу неможливо довести. Для будь-якого фіксованого, кінцевого розміру вибірки завжди буде невеликий, але ненульовий розмір ефекту, для якого ваш статистичний тест практично не має сили. Однак, більш практично, ви можете довести, що ви знаходитесь в деякому невеликому епізолі нульової гіпотези, так що відхилення, менші за цей епсилон, практично не значні.
Є випадок, коли доказ можливий. Припустимо, у вас є школа, і ваша нулева гіпотеза полягає в тому, що кількість хлопчиків і дівчаток однакова. Зі збільшенням кількості вибірки невизначеність у співвідношенні хлопчиків і дівчаток має тенденцію до зменшення, зрештою, досягаючи визначеності (що я припускаю, ви маєте на увазі під собою доказ), коли вся вибіркова група учнів.
Але якщо у вас немає кінцевої сукупності або якщо ви беруть вибірку із заміною і не можете помітити повторно відібраних осіб, ви не можете зменшити невизначеність до нуля за допомогою кінцевої вибірки.
Я хотів би обговорити тут точку, що багато користувачів дещо плутаються. Яке справжнє значення твердження Нульової гіпотези H0: p = 0? Чи намагаємося ми визначити, чи параметр p дорівнює нулю? Звичайно ні, немає способу досягти такої мети.
Що ми маємо намір встановити, це те, що, зважаючи на набір даних, оцінене значення параметра не може бути помітним від нуля. Пам'ятайте, що NHST "несправедливо" щодо альтернативних гіпотез: нуль присвоюється 95% рівня довіри і лише 5% до альтернативного. Як наслідок, "несуттєвий" результат не означає, що H0 справедливий, а просто те, що ми не знайшли достатніх доказів того, що альтернатива є ймовірною.