Розглянемо невеликий набір даних (на малюнку нижче) із середнім значенням , скажімо, що ви провели двоступеневий -тест з , де . Тест видається незначним при . Чи означає це, що ваш справжній? Що робити, якщо ви протестували проти ? Оскільки розподіл симетричний, тест повертає аналогічну величину. Отже, у вас є приблизно стільки ж доказів, що і що .x¯≈0tH0:x¯=μμ=−0.5p>0.05H0μ=0.5tpμ=−0.5μ=0.5
Наведений вище приклад показує , що мале -значення відводить нас від віри в і що високі -значення припустити , що наші дані як - то більше відповідає , в порівнянні з . Якби ви провели багато таких тестів, ви могли б знайти таке яке, швидше за все, дано наші дані, і фактично ви б використовували напівмаксимальну оцінку ймовірності . Ідея MLE полягає в тому, щоб ви шукали таке значення яке максимально збільшує ймовірність спостереження за вашими даними даними , що призводить до імовірності функціїpH0pH0 H1μμμ
L(μ|X)=f(X|μ)
MLE - це дійсний спосіб пошуку точки оцінки для , але він нічого не говорить про ймовірність спостереження за вашими даними. Що ви зробили, це ви вибрали єдине значення для і запитали про ймовірність спостереження за даними вашими даними. Як уже помітили інші, . Щоб знайти нам потрібно було б врахувати той факт, що ми перевірили різні значення кандидатів для . Це призводить до теореми Байєсаμ^μ^μ^f(μ|X)≠f(X|μ)f(μ|X)μ^
f(μ|X)=f(X|μ)f(μ)∫f(X|μ)f(μ)dμ
що перший, вважає , як , ймовірно , відрізняються «s апріорі (це може бути однорідним, що і призводить до результатів , узгоджується з ЗМЗ) та другий, нормалізує за те , що ви вважали різних кандидатів на . Більше того, якщо ви запитаєте про з імовірнісним виразом, вам потрібно розглянути це як випадкову змінну, тому це ще одна причина для прийняття байєсівського підходу.μμ^μ
Підсумовуючи, тест гіпотези говорить про те, що більше ймовірний, ніж , але оскільки процедура вимагала, щоб ви припустили, що є істинним, і вибрати для нього конкретне значення. Щоб дати аналогію, уявіть, що ваш тест - це оракул. Якщо ви запитаєте її: "земля мокра, чи можливо, що йшов дощ?" , вона відповість: "так, можливо, у 83% випадків, коли йшов дощ, земля стає мокрою" . Якщо ви запитаєте її ще раз, "чи можливо, хтось просто пролив воду по землі?" , вона відповість "впевнено, це теж можливо, у 100% випадків, коли хтось пролив воду на землю, вона стає мокрою"H1H0H0і т. д. Якщо ви попросите її для якихось цифр, вона дасть вам їх, але цифри не були б порівнянні . Проблема полягає в тому, що тест гіпотези / оракул працює в рамках, де вона може дати переконливі відповіді лише на запитання, чи відповідають дані, якась гіпотеза , а не навпаки, оскільки ви не розглядаєте інші гіпотези.