Якщо принцип ймовірності зіткнеться з частою частотою ймовірності, тоді ми відкинемо одну з них?


19

У коментарі, нещодавно опублікованому тут, один із коментаторів вказав на блог Ларрі Вассермана, який зазначає (без жодних джерел), що частота виводки суперечить принципу ймовірності.

Принцип ймовірності просто говорить, що експерименти, що дають подібні функції ймовірності, повинні давати аналогічні умовиводи.

Дві частини цього питання:

  1. Які частини, аромат чи школа частого виведення конкретно порушують принцип ймовірності?

  2. Якщо сталося зіткнення, чи потрібно відмовлятись одне чи інше? Якщо так, то який з них? Я заради обговорення підкажу, що якщо нам доведеться щось відкинути, то ми повинні відкинути частини частолістських висновків, які зіштовхуються, бо Хакінг і Ройал переконали мене, що принцип ймовірності є аксіоматичним.


2
Я ніколи не розумів, чому принцип ймовірності повинен бути аксіомою.
Стефан Лоран

6
Привіт, Стефане. Проблема полягає в тому, що Бірнбаум довів, що ймовірність рівнозначна двом іншим принципам, які є настільки природними, що їх обов'язково слід дотримуватися. Ми написали короткий огляд щодо цього результату. Тут: ime.usp.br/~pmarques/papers/redux.pdf
Дзен

@Zen Дякую На перший погляд, я не згоден з цим реченням, написаним за принципом обумовленості: "Важливо те, що насправді сталося". Натомість я повинен сказати "Що важливо, що насправді сталося серед проблем, які могли виникнути" (вибачте, якщо моя англійська мова не є правильною) Це я стверджував у своїй дискусії з gui11aume: певний принцип ймовірності стверджує, що дизайн експерименту не має значення, і я не можу погодитися з цим пунктом.
Стефан Лоран

1
@Zen Тепер я більш уважно прочитав твій документ. Це правда, що важко не погодитися з принципом умовності та принципом інваріантності.
Стефан Лоран

1
LP не настільки популярний в наш час з практичних причин. Прийнявши це релігійно, ви уникаєте використання залежних від моделі пріорів, таких як попереднє, кон'юговане пріорі та тестування гіпотез, яке може бути корисним у багатьох контекстах. Я вважаю , що статистичні дані, так само , як фізика , не можуть бути axiomatised значущим чином (хоча це обговорення може звучати як це ). Але важливо визначити переваги та недоліки різних парадигм.

Відповіді:


12

Частиною підходу частотолога, який суперечить принципу ймовірності, є теорія статистичного тестування (та обчислення p-значень). Зазвичай це виділяється наступним прикладом.

Припустимо, два частоцентологи хочуть вивчити упереджену монету, яка повертає «голови» з невідомою прошивкою . Вони підозрюють , що вона зміщена в бік «хвоста», тому вони постулюють ж нульової гіпотези р = 1 / 2 і та ж альтернативна гіпотеза р < 1 / +2 .pp=1/2p<1/2

Перший статистик перевертає монету до тих пір, поки "голови" не з'являться, що трапляється 6 разів. Другий вирішує перевернути монету 6 разів, а в останньому киданні отримує лише одну «голову».

Відповідно до моделі першого статистики, р-значення обчислюється так:

p(1p)5+p(1p)6+...=p(1p)511p=p(1p)4.

Відповідно до моделі другого статистичного показника, р-значення обчислюється так:

(61)p(1p)5+(60)(1p)6=(5p+1)(1p)5.

Заміна від 1 / 2 , перші знахідки р-значення , рівне 1 / 2 5 = 0,03125 , другий знаходить р-значення , рівне 7 / 2 × 1 / 2 5 = 0.109375 .p1/21/25=0.031257/2×1/25=0.109375

Отже, вони отримують різні результати, тому що робили різні речі, правда? Але за принципом ймовірності вони повинні дійти такого ж висновку. Якщо коротко, принцип ймовірності стверджує, що вірогідність - це все, що має значення для висновку. Тож зіткнення тут походить від того, що обидва спостереження мають однакову ймовірність, пропорційну (вірогідність визначається до постійної пропорційності).p(1p)5

Наскільки я знаю, відповідь на ваше друге запитання - це більше дискусійна думка. Я особисто намагаюся уникати виконання тестів та обчислення р-значень з цієї причини, а також для інших, пояснених у цій публікації в блозі .

EDIT: Тепер, коли я думаю про це, оцінки за довірчими інтервалами також будуть різними. Насправді, якщо моделі різні, то ІС відрізняються за конструкцією.p


1
У мене складається враження, що принцип імовірності очевидно порушується в статистиці частолістів (тестування гіпотез, довірчі інтервали), оскільки ми беремо до уваги ймовірність кожного можливого результату, а не лише ймовірність, що ґрунтується на фактичному результаті. Правильно?
Stéphane Laurent

@ Stéphane Laurent так, це теж я розумію. У Джеймса Бергера є приємна цитата в Теорії статистичних рішень та Байєсівському аналізі , де сказано, що часто лікар часто відкидає гіпотезу через дані, які ніколи не спостерігалися (це звучить краще, але я не можу це пригадати).
gui11aume

Дякую, gui11aume. Чи правильно я трактую це як приклад, коли «значення» P-значень змінюється залежно від наміру експериментатора? Я припускаю, що це той випадок, коли значення P трактуються як свого роду порогова помилкова позитивна помилка, оскільки їх треба було б рівномірно розподілити під нульовою гіпотезою? Це потрібно при підході Фішера, де значення Р подаються як показники міцності доказів?
Майкл Лев

4
(+1) Цей тип розбіжностей зазвичай з'являється, коли в одній із моделей задіяно правило зупинки .

1
@Scortchi Насправді я помилявся, думаючи, що одне з P-значень вказує на правильну функцію ймовірності, а інше ні: вони обоє вказують на одну і ту ж функцію ймовірності, яка справді представляє докази, що стосуються ймовірності голови. Вам слід проігнорувати останні два речення мого попереднього коментаря. (Я не можу його відредагувати, чи не так?)
Майкл Лев

4

Мені подобається приклад від @ gui11aume (+1), але може скластись враження, що різниця у двох -значеннях виникає лише завдяки різним правилам зупинки, якими користуються два експериментатори.p

TTTTTH,
p764p=7/640.109

3p=3/640.047

α=0.05


Спекулятивна частина

Тепер, по-філософськи, я б сказав, що частістський вибір тестової статистики в деякому розпливчастому сенсі схожий на байєсівський вибір попереднього. Ми обираємо ту чи іншу статистику тесту, оскільки вважаємо, що несправедлива монета поводитиметься тим чи іншим чином (і ми хочемо мати владу для виявлення такої поведінки). Хіба це не схоже на попереднє розміщення монет?

ppp

Мені було б дуже цікаво почути деякі думки щодо цієї спекулятивної частини тут чи в чаті.


Оновіть після обговорення з @MichaelLew

ppp

Мені все ж доводиться думати, що це означає для моєї "спекулятивної" частини вище.


Цікаві думки. Так, я погоджуюся з тим, що між значеннями LP та P не повинно бути конфлікту, доки значення P не трактуються як докази так само, як функція ймовірності. Функція ймовірності містить докази, що мають відношення до параметра, що цікавить дані статистичної моделі . Коли ви змінюєте статистику тесту, ви змінюєте модель, тому функція ймовірності для вашої альтернативної моделі (може, може) відрізняється від функції ймовірності для оригіналу.
Майкл Лью

p

Окрім цього, я знайшов це питання, оскільки перечитував ваш папір "До Р чи не до Р" (і гугл "принцип правдоподібності"). Як правило, мені подобається папір, але я повністю заплутався у розділі 4.4. Ви пишете, що значення p не слід «коригувати», враховуючи правила зупинки; але я не бачу жодних коригувань у формулах 5-6. Якими були б "невідрегульовані" p-значення? Ви маєте на увазі, що одна з них налаштована, а інша - ні? Якщо так, то який, а чому не навпаки?
амеба каже: Відновіть Моніку

Статистичну модель часто ігнорують або негласно вважають інваріантною. Однак для монет вона включає фіксовану невідому ймовірність головок, випадковий вибір спостережень, а для статистики випробувань, що не перебувають у голові, біноміальний розподіл можливих результатів. Я не знаю, який розподіл результатів є для хвостів у рядковій тестовій статистиці, але я підозрюю, що він різний. Навіть якщо це однаково, модель, яка має вашу тестову статистику, не є такою ж моделлю, як оригінал, тому функція ймовірності може бути різною, хоча вона містить усі дані.
Майкл Лью

Я майже закінчив повну переробку цього документу. Це стосується цього обговорення, але ще не готове до подання. (Це чат?)
Майкл Лью
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.