Навіщо нам потрібна альтернативна гіпотеза?


14

Коли ми робимо тестування, ми отримуємо два результати.

1) Ми відкидаємо нульову гіпотезу

2) Ми не можемо відкинути нульову гіпотезу.

Ми не говоримо про прийняття альтернативних гіпотез. Якщо ми не говоримо про прийняття альтернативної гіпотези, навіщо нам взагалі існувати альтернативна гіпотеза?

Ось оновлення: чи міг би хтось надати мені два приклади:

1) відхилення нульової гіпотези дорівнює прийняттю альтернативної гіпотези

2) відкидання нульової гіпотези не дорівнює прийняттю альтернативної гіпотези


1
Тому що ви намагаєтесь зробити деякі висновки. Якщо це не нулева гіпотеза, то, можливо, це альтернативна гіпотеза (навіть якщо ви не зовсім впевнені, що альтернативна гіпотеза є дійсною, якщо ви відкинете нульову гіпотезу). Коли ви відкидаєте нульову гіпотезу, ви говорите, що у вас є деякі "докази" для висновку про те, що альтернативна гіпотеза може бути істинною.
nbro

@nbro, дякую, я додав питання до своєї початкової публікації. Не могли б ви подивитись?
користувач1700890

1
Я взагалі не надто знайомий з тестуванням гіпотез. Краще ви зачекаєте, коли більш відповідальна людина відповість на ваші запитання.
nbro

Якщо ваша альтернативна гіпотеза є доповненням нульової гіпотези, використовувати її взагалі немає сенсу. Ніхто не використовує альтернативні гіпотези на практиці з цих причин поза підручниками.
Аксакал

"Ми не говоримо про прийняття альтернативних гіпотез" - не вірно для всіх можливих "ми". Деякі люди говорять про прийняття альтернативної гіпотези, а багато інших думають про це, навіть якщо вони поважають табу проти її вимови . Дещо педантичним є уникнення розмови про прийняття альтернативної гіпотези, коли немає жодного розумного сумніву, що це правда. Але оскільки статистика настільки схильна до нецільового використання, в цьому випадку педантизм є, мабуть, хорошою справою, оскільки він викликає обережність у інтерпретації результатів.
Джон Коулман

Відповіді:


8

Я зупинюсь на "Якщо ми не говоримо про прийняття альтернативної гіпотези, чому нам взагалі потрібно мати альтернативну гіпотезу?"

Тому що це допомагає нам вибрати змістовну статистику тесту та спроектувати наше дослідження таким чином, щоб мати високу потужність --- високий шанс відхилити нуль, коли альтернатива є правдою. Без альтернативи у нас немає поняття влади.

Уявіть, у нас є лише нулева гіпотеза і альтернативи немає. Тоді немає вказівок щодо вибору тестової статистики, яка матиме високу потужність. Все, що ми можемо сказати, це: "Відхиляйте нуль кожного разу, коли ви спостерігаєте тестову статистику, значення якої навряд чи є під нулем". Ми можемо вибрати щось довільне: ми могли б намалювати Уніфіковані (0,1) випадкові числа та відкинути нуль, коли вони нижче 0,05. Це відбувається під нулем "рідко", не більше 5% часу --- але це також так само рідко, коли нуль помилковий. Тож це технічно статистичний тест, але він безглуздий як доказ ні за що, ні проти.

Натомість зазвичай у нас є певна науково-правдоподібна альтернативна гіпотеза ("У моєму експерименті є позитивна різниця у результатах між групами лікування та контролем"). Ми хотіли б захистити її від потенційних критиків, які б висунули нульову гіпотезу як захисників диявола ("я ще не переконаний --- можливо, ваше лікування насправді болить, або не має ніякого ефекту , і будь-яка явна різниця в дані обумовлені лише варіацією вибірки ").

Маючи на увазі ці 2 гіпотези, тепер ми можемо налаштувати потужний тест, вибравши тестову статистику, типові значення якої за альтернативою навряд чи є нульовою. (Позитивна t-статистика 2-зразка, далека від 0, не дивуватиметься, якщо альтернатива вірна, але дивно, якщо нуль відповідає дійсності.) Тоді ми з'ясуємо тестовий розподіл вибірки під нулем, щоб ми могли обчислити значення p --- і інтерпретувати їх. Коли ми спостерігаємо тестову статистику, що навряд чи буде під нульовим значенням, особливо якщо проект дослідження, розмір вибірки тощо були обрані таким чином, що мають високу потужність , це забезпечує деякі докази альтернативи.

То чому б ми не говорили про "прийняття" альтернативної гіпотези? Тому що навіть потужне дослідження не дає повністю суворих доказів того, що нуль помиляється. Це все-таки вид доказів, але слабший, ніж деякі інші види доказів.


7

Історично існували розбіжності щодо необхідності альтернативної гіпотези. Дозвольте мені пояснити цю суперечність, розглянувши думку Фішера та Неймана в контексті частотистської статистики та байєсівську відповідь.

  • Фішер - нам не потрібна альтернативна гіпотеза; ми можемо просто перевірити нульову гіпотезу, використовуючи тест на придатність. Результатом є p -значення, що забезпечує міру доказів нульової гіпотези.

  • Нейман - Ми повинні провести тест на гіпотезу між нулем та альтернативою. Тест такий, що призведе до помилок типу 1 з фіксованою, заздалегідь заданою швидкістю, α . Результатом є рішення - відхилити чи не відхилити нульову гіпотезу на рівні α .

    Нам потрібна альтернатива з точки зору теоретичного рішення - ми робимо вибір між двома напрямами дії - і тому, що нам слід повідомити про потужність тесту

    1p(Accept H0|H1)
    Ми повинні шукати найпотужніші можливі тести, щоб мати найкращі шанси відхилитиH0 коли альтернатива відповідає дійсності.

    Щоб задовольнити обидва ці пункти, альтернативна гіпотеза не може бути невиразною 'не H0 '.

  • Bayesian - Ми повинні розглянути принаймні дві моделі та оновити відносну правдоподібність даних. Маючи лише одну модель, ми просто маємо

    p(H0)=1
    незалежно від того, які дані ми збираємо. Для здійснення розрахунків у цій рамках альтернативна гіпотеза (або модель, як це було б відомо в цьому контексті) не може бути неправильно визначеною 'не H0 '. Я називаю це неправильно визначеним, оскільки ми не можемо записати модель p(data|not H0) .


1
Ваша остання думка є чудовою і часто нехтується публікаціями, які базують всю свою аргументацію на єдиному немотивованому NHST.
Конрад Рудольф

Чому «не погано визначені? H0
Майкл

Що це? Чи можете ви обчислити ? p(data|notH0)
innisfree

@innisfree за участю частолюдницької концепції, але, ймовірно, під байєсівською.
Майкл

Спробуйте це зробити, не вводячи принаймні 2 моделі ...
innisfree

4

Я не на 100% впевнений, що це формальна вимога, але зазвичай нульова гіпотеза та альтернативна гіпотеза: 1) взаємодоповнюючі та 2) вичерпні. Тобто: 1) вони не можуть бути одночасно істинними; 2) якщо одна не відповідає дійсності, інша повинна бути правдою.

Розглянемо простий тест на висоту між дівчатами та хлопцями. Типовою нульовою гіпотезою в цьому випадку є те, що годеiггодтбоус=годеiггодтгirлс . Альтернативною гіпотезою була б годеiггодтбоусгодеiггодтгirлс . Тож якщо null не відповідає дійсності - альтернатива повинна бути істинною.


1
Я повністю погоджуюся з вашими твердженнями, але слід зазначити, що і і H a є, як правило, нескінченно великими наборами нульових гіпотез. Крім того , здається , що багато хто переконаний в тому, що H 0 і H потреба не бути вичерпним, наприклад , див це або це обговорення. H0HaH0Ha
bi_scholar

2
@bi_scholar дякую за теми обговорення. Я не експерт у цьому, але грунтуючись на простих міркуваннях, я вважаю, що вони повинні бути вичерпними. Розглянемо це дивне випробування: хтось знаходить 5 скель, упорядкованих по порядку на дорозі. Його : вітер зробив це. Його H 1 : це були прибульці. Тепер, якщо він перевіряє шанс, що це зробив вітер, і виявить ймовірність 0,0001 - він відкидає гіпотезу про вітер. Але це не дає йому права стверджувати, що це прибульці. Все, що він може стверджувати, - це те, що шанс, що це вітер, невеликий. Але будь-яке інше пояснення залишається відкритим. H0H1
Кароліс Концевічус

1
Я згоден. Моє міркування полягало в тому, що тестування гіпотез стосується прийняття або відхилення під час відхилення або прийняття H a . Якщо H 0 і H a не є вичерпними, то немає жодного сенсу визначати будь-яку H a , оскільки навіть коли ми відхиляємо H 0, ми не можемо прийняти H a , оскільки існують інші гіпотези поза H 0 і H a, які можуть також бути правдою. На жаль, мені не вдалося переконатись у першій темі. H0HaH0HaHaH0HaH0Ha
bi_scholar

1
@innisfree можна перевірити дві точкові гіпотези в якихось вірогідних рамках - точно. Але ця процедура не обставила б назву "перевірка нульової гіпотези", і це неточно. Він обрав би найбільш близький як істинний навіть у тих випадках, коли жоден з них не відповідає дійсності. Крім того, що стосується потужності - можна обрати альтернативну гіпотезу чи розмір ефекту при розрахунку потужності тесту, але (на мій погляд) слід забути його, як тільки відбувається тестування. Якщо не існує деякої попередньої інформації, яка говорить йому про можливі ефекти, наявні в даних. Можливо, білі / чорні пікселі на галасливій фотографії.
Кароліс Концевічус

1
@innisfree Мені цікаво, як виглядав би такий тест, чи могли б ви сформулювати невеликий приклад? Я переконаний, що ми не можемо прийняти , відкинувши H 0, якщо θ { 0 , 1 }, що відповідає H 0 і H 1, не є вичерпним. θ=1H0θ{0,1}H0H1
bi_scholar

2

Чому нам взагалі потрібна альтернативна гіпотеза?

У тесті класичної гіпотези єдина математична роль, яку відіграє альтернативна гіпотеза, полягає в тому, що вона впливає на впорядкування доказів за допомогою обраної статистики тесту. Альтернативна гіпотеза використовується для визначення відповідної статистики тесту для тесту, яка еквівалентна встановленню порядкового ранжування всіх можливих результатів даних від тих, що найбільш сприятливі для нульової гіпотези (проти заявленої альтернативи) до тих, що найменш сприятливі для нульових гіпотез (проти заявленої альтернативи). Після того як ви сформували цей порядковий рейтинг можливих результатів даних, альтернативна гіпотеза не грає додаткової математичної ролі в тесті .


Формальне пояснення: В будь-класичної перевірці гіпотези з n спостережуваних значень даних x=(x1,...,xn) у вас є певний тест статистика T:RnRщо відображає всі можливі результати даних в порядковій шкалі, яка вимірює, чи сприяє це нульова або альтернативна гіпотеза. (Без втрати загальності ми будемо вважати, що більш низькі значення сприятливіші для нульової гіпотези, а більш високі значення сприятливіші для альтернативної гіпотези. Іноді ми говоримо, що більш високі значення тестової статистики є "більш крайніми", наскільки вони є більш екстремальними докази альтернативної гіпотези.) Значення р тесту надається:

p(x)pT(x)P(T(X)T(x)|H0).

Ця функція p-значення повністю визначає докази тесту для будь-якого вектора даних. У поєднанні з обраним рівнем значущості він визначає результат тесту для будь-якого вектора даних. (Ми описали це для фіксованої кількості точок даних n але це може бути легко розширено, щоб дозволити довільну n .) Важливо зазначити, що на значення p впливає статистика тесту лише через порядкову шкалу, яку він викликає, тож якщо ви застосуєте монотонно зростаючу трансформацію до тестової статистики, це не має значення для тесту гіпотези (тобто це той самий тест). Ця математична властивість лише відображає той факт, що єдиною метою тестової статистики є наведення порядкового масштабу на просторі всіх можливих векторів даних, щоб показати, які є більш сприятливими для нуля / альтернативи.

Альтернативна гіпотеза впливає на це вимірювання лише через функцію T , яку вибирають виходячи із заявленої нульової та альтернативної гіпотези в межах загальної моделі. Отже, ми можемо розглядати тестову статистичну функцію як функцію Tg(M,H0,HA) загальної моделі M та двох гіпотез. Наприклад, для тесту на коефіцієнт правдоподібності тестова статистика формується шляхом взяття співвідношення (або логарифму відношення) надпромінів функції ймовірності щодо діапазонів параметрів, що стосуються нульової та альтернативної гіпотез.


Що це означає, якщо ми порівнюємо тести з різними альтернативами?MH0HAHA

T=g(M,H0,HA)T=g(M,H0,HA),

що веде до відповідних функцій p-значення:

p(x)=P(T(X)T(x)|H0)p(x)=P(T(X)T(x)|H0).

Важливо зазначити, що якщо T і TppTT


2
Я погодився би з цим, сказавши, що тест призначений для відхилення нульової гіпотези, коли стикаються з крайніми результатами, а роль альтернативної гіпотези полягає в тому, щоб результати були розцінені як крайні, якби нульова гіпотеза була правдивою
Генрі

1

Причиною, яку я не думаю прийняти альтернативну гіпотезу, є те, що це не те, що ми тестуємо. Тестування значимості нульової гіпотези (NHST) обчислює ймовірність спостереження за даними як екстремальні, як спостерігали (або більше), враховуючи, що нульова гіпотеза є істинною, або іншими словами, NHST обчислює значення ймовірності, яке обумовлюється тим, що нульова гіпотеза є істинною ,P(data|H0)H0

α

Причина, чому ви формулюєте альтернативну гіпотезу, полягає в тому, що ви, ймовірно, мали на увазі експеримент перед тим, як розпочати вибірку. Сформулюючи альтернативну гіпотезу, можна також вирішити, чи використовуєте ви тест з однохвостим або двохвостим і, таким чином, надаєте більше статистичної потужності (за односхилим сценарієм). Але технічно для того, щоб виконати тест, вам не потрібно формувати альтернативну гіпотезу, вам просто потрібні дані.


NHST не обчислює ; він обчислює P ( дані такі екстремальні, як і спостереження | HP(data|H0)P(data as extreme as that observed|H0)

@innisfree Я згоден, і саме так я визначив дані в тому самому реченні.
Стефан

? Я не бачу ніде, де визначені дані (таким чином чи будь-яким іншим способом)
недоброзичливо,

І навіть якби це було, навіщо це робити? Навіщо переробляти дані таким чином? Я б радив уточнити частини тексту навколо р (дані ..
безперечно
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.