Коротше кажучи, аргумент Бірнбаума полягає в тому, що два широко прийняті принципи логічно означають, що принцип правдоподібності повинен дотримуватися. Контр аргумент Майо полягає в тому, що доказ помиляється, оскільки Бірнбаум зловживає одним із принципів.
Нижче я спрощую аргументи настільки, що вони не дуже жорсткі. Моє призначення - зробити їх доступними для широкої аудиторії, оскільки оригінальні аргументи дуже технічні. Зацікавлені читачі повинні побачити деталі у статтях, пов’язаних із запитанням та у коментарях.
Для конкретності я зупинюсь на справі монети з невідомим ухилом . В експерименті ми гортаємо 10 разів. В експерименті ми гортаємо його, поки не отримаємо 3 "хвости". В експерименті ми перевертаємо справедливу монету з позначкою "1" і "2": якщо вона розташована на "1", ми виконуємо ; якщо він знаходиться на "2", ми виконуємо . Цей приклад значно спростить дискусію та покаже логіку аргументів (оригінальні докази, звичайно, більш загальні).θE1E2EmixE1E2
Принципи:
Наступні два принципи широко прийняті:
Принцип слабкої обумовленості говорить про те, що ми повинні робити ті самі висновки, якщо ми вирішимо провести експеримент , або якщо вирішимо виконати і монета "1".E1Emix
Принцип достатності говорить, що ми повинні робити однакові висновки в двох експериментах, коли достатня статистика має однакове значення.
Наступний принцип прийнятий байесовским, але не часто. І все-таки Бірнбаум стверджує, що це логічний наслідок перших двох.
Принцип ймовірності говорить, що ми повинні робити однакові висновки у двох експериментах, де ймовірнісні функції пропорційні.
Теорема Бірнбаума:
Скажімо, ми виконуємо і отримуємо 7 "голів" з десяти фліп. Імовірність функції дорівнює . Виконуємо і перевертаємо монету 10 разів, щоб отримати 3 «хвости». Імовірність функції дорівнює . Дві функції ймовірності пропорційні.E1θ(103)θ7(1−θ)3E2θ(97)θ7(1−θ)3
Бірнбаум розглядає наступну статистику на від до :
де і - числа "голови" та "хвости" відповідно. Отже, незалежно від того, що трапиться, повідомляє про результат так, ніби він був результатом експерименту . Виявляється, достатньо для в . Єдиний випадок, який нетривіальний, це коли і , де маємоEmix{1,2}×N2{1,2}×N2T:(ξ,x,y)→(1,x,y),
xyTE1TθEmixx=7y=3
P(Xmix=(1,x,y)|T=(1,x,y))=0.5×(103)θ7(1−θ)30.5×(103)θ7(1−θ)3+0.5×(97)θ7(1−θ)3=(103)(103)+(97).
Усі інші випадки дорівнюють 0 або 1 - за винятком , що є доповненням вищевказаної ймовірності. Розподіл даного не залежить від , тому є достатньою статистикою для .P(Xmix=(2,x,y)|T=(1,x,y))XmixTθTθ
Тепер, згідно з принципом достатності, ми повинні зробити висновок того ж для і в , а з принципу слабкої умовності ми повинні зробити те саме для в і в , а також для в і в . Тож наш висновок повинен бути однаковим у всіх випадках, що є принципом ймовірності.(1,x,y)(2,x,y)Emix(x,y)E1(1,x,y)Emix(x,y)E2(2,x,y)Emix
Контрдоказ:
Установка Бірнбаума не є експериментом із сумішами, оскільки результату монети з позначкою "1" та "2" не дотримувалося , тому принцип слабкої умовності не поширюється на цей випадок .
Візьміть тест проти і зробіть висновок з p-значення тесту. В якості попереднього спостереження зауважимо, що значення р в задається біноміальним розподілом приблизно ; p-значення в задається від'ємним розподілом біномів як приблизно .θ=0.5θ>0.5(7,3)E10.1719(7,3)E20.0898
Ось важлива частина: р-значення в задається як середнє значення двох - пам’ятайте, ми не знаємо статус монети - тобто приблизно . Тим не менш, р-значення в - там, де спостерігається монета, - те саме, що і в , тобто приблизно . Принцип слабкої умовності дотримується (висновок такий самий як в і в де монета знаходиться "1"), і все ж принцип ймовірності не відповідає. Контрприклад спростовує теорему Бірнбаума.T=(1,7,3)Emix 0,1309 ( 1 , 7 , 3 )0.1309(1,7,3)EmixE1 0,1719 E 1 E m i x0.1719E1Emix
Спростування Пенья та Бергера про протидоказ Майо:
Майо неявно змінила твердження про принцип достатності: вона інтерпретує "ті самі висновки" як "той самий метод". Прийняття р-значення - це метод висновку, але не висновок.
Принцип достатності говорить про те, що якщо існує достатня статистика, то висновки повинні бути однаковими, але він взагалі не вимагає достатньої статистики. Якщо це станеться, це призвело б до суперечності, як це демонстрував Майо.