Еквівалентність ніколи не є те, що ми можемо перевірити . Подумайте над гіпотезою:Н0:fх≠fу проти Н1:fх=fу. Теорія NHST говорить нам , що під нуль, ми можемо вибрати що - небудь підН0що найкраще відповідає даним. Це означає, що ми майже завжди можемо довільно наблизитись до розподілу. Наприклад, якщо я хочу протестуватиfх∼ N( 0 , 1 ), ймовірнісна модель, яка дозволяє проводити окремі розподіли f^х і f^узавжди буде більше імовірним, якщо це є нульовим, порушення критичних припущень тестування. Навіть якщо зразокХ= Y однаково я можу отримати коефіцієнт ймовірності, який довільно близький до 1 с fу≈fх.
Якщо ви знаєте відповідну модель ймовірності для даних, ви можете використовувати критерій пеніфікованої інформації для ранжирування альтернативних моделей. Один із способів полягає у використанні BIC двох моделей ймовірностей (тієї, що оцінюється підН0 і Н1. Я використовував звичайну модель ймовірності, але ви можете легко отримати BIC з будь-якого типу процедури максимальної ймовірності, вручну або за допомогою GLM. Цей пост Stackoverflow отримує азотну крупу для підгонки розподілу. Приклад цього можна зробити тут:
set.seed(123)
p <- replicate(1000, { ## generate data under the null
x <- rnorm(100)
g <- sample(0:1, 100, replace=T)
BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)
дає
> mean(p)
[1] 0.034
pтут пропорція разів, коли BIC нульової моделі (окремі моделі) краща (нижча), ніж альтернативна модель (еквівалентна модель). Це надзвичайно близько до номінального рівня 0,05 статистичних тестів.
З іншого боку, якщо взяти:
set.seed(123)
p <- replicate(1000, { ## generate data under the null
x <- rnorm(100)
g <- sample(0:1, 100, replace=T)
x <- x + 0.4*g
BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)
Дає:
> mean(p)
[1] 0.437
Як і у NHST, існують тонкі питання щодо потужності та помилково позитивних помилок, які слід вивчити за допомогою моделювання, перш ніж робити остаточні висновки.
Я думаю, що аналогічний (можливо, більш загальний метод) використовує баєсівську статистику для порівняння задніх оцінок за будь-якою імовірнісною моделлю.