Моя особиста оцінка його аргументів:
- Тут він розповідає про використання як доказів для Null, тоді як його теза полягає в тому, що p не може бути використаний як доказ проти Null. Отже, я вважаю, що цей аргумент багато в чому не має значення.pp
- Я думаю, що це непорозуміння. Фіширське тестування рішуче випливає з ідеї критичного раціоналізму Поппера, яка стверджує, що ви не можете підтримувати теорію, а лише критикувати її. Тож у цьому сенсі існує лише одна гіпотеза (Null), і ви просто перевіряєте, чи відповідають ваші дані.p
- Я тут не згоден. Це залежить від статистики тесту, але зазвичай є перетворенням розміру ефекту, що говорить проти Null. Отже, чим більший ефект, тим менше значення р --- всі інші речі рівні. Звичайно, для різних наборів даних або гіпотез це більше не діє. p
- Я не впевнений , що я повністю розумію це твердження, але від того, що я можу зібрати це менше , проблема як людей , що використовують його неправильно. p повинен був мати довгострокову інтерпретацію частоти, і це особливість, а не помилка. Але ви не можете звинувачувати p у тому, що люди приймають єдине значення p як доказ своєї гіпотези, або люди, які публікують лише p < .05 . ppppр < .05
Його пропозиція використовувати коефіцієнт ймовірності в якості міри доказів, на мою думку, є гарною (але тут ідея фактора Байєса є загальнішою), але в контексті, в якому він приносить це, дещо властиво: Спочатку він залишає підстави рибного тестування, коли немає альтернативної гіпотези для обчислення коефіцієнта ймовірності. Але в якості доказу проти Null є Fisherian. Звідси він бентежить Фішера та Неймана-Пірсона. По-друге, більшість тестових статистичних даних, які ми використовуємо, є (функціями) коефіцієнта ймовірності, і в цьому випадку p є перетворенням коефіцієнта ймовірності. Як стверджує Косма Шалізі :pp
серед усіх випробувань заданого розміру , те, що має найменшу ймовірність пропуску або найвищу потужність, має форму "сказати" сигнал ", якщо
q ( x ) / p ( x ) > t ( s ) , інакше сказати" шум " , "і що поріг t
змінюється обернено з s . Кількість q ( x ) / p ( x ) - коефіцієнт ймовірності; лемма Неймана-Пірсона говорить, що для максимізації потужності нам слід сказати "сигнал", якщо це достатньо ймовірніше, ніж шум.сq( x ) / p ( x ) > t ( s )тсq( x ) / p ( x )
Тут - щільність під станом "сигнал", а p ( x ) - щільність при стані "шум". Тут мірою для "досить вірогідного" буде P ( q ( X ) / p ( x ) > t o b s ∣ H 0 ), який є p . Зауважимо, що при правильному тестуванні Неймана-Пірсона t o b s заміщений фіксованим t ( s ) таким, що Pq( х )p ( x )П( q( X) / p ( x ) > to b s∣ Н0)pтo b st ( s ) . П( q( X) / p ( x ) > t ( s ) ∣ H0) = α