Що поганого в коміксі XKCD "Честота проти Байєсів"?


113

xkcd комічний номер 1132

Цей комікс xkcd ("Частоліньки проти Байєсів") висміює частоцистського статистику, який отримує очевидно неправильний результат.

Однак мені здається, що його міркування насправді правильні в тому сенсі, що вони відповідають стандартній методології часто.

Отже, моє запитання: "чи правильно він застосовує методологію частолістів?"

  • Якщо ні: що було б правильним частота виводу в цьому сценарії? Як інтегрувати «попередні знання» про стійкість до сонця у методологію частотистів?
  • Якщо так: wtf? ;-)

17
Обговорення в блозі Gelman
Glen

5
Я думаю, що багато що не так, як з точки зору частості, так і байесів. Моя найбільша критика кожного: По-перше, значення P - це в кінцевому рахунку евристика і є властивостями ряду речей, включаючи статистичну проблему, дані та експеримент. Тут усі троє є неправдивими для цього конкретного питання. По-друге, "баєсівський" використовує теоретичний підхід рішення, який не повинен бути баєсівським. Дуже смішно.
Момо

5
Щоб вийняти це зі сфери статистики .... сонце недостатньо масивне, щоб піти на нову. QED, байєсівський правий. ( Сонце замість цього стане Червоним гігантом )
Бен Брокка

3
@Glen et alii, зокрема, зверніть увагу на відповідь Рендалла Манро на Гельмана: andrewgelman.com/2012/11/16808/#comment-109366
jthetzel

2
Причина, що тут часто проводить статистик, є дурним не в тому, що він частофіліст, а тому, що він, очевидно, знає, як працює машина, тому знає, що це невідповідне вимірювання - і все одно робить висновок.
rvl

Відповіді:


44

Основне питання полягає в тому, що перший експеримент (Sun gone nova) не повторюється, що робить його дуже непридатним для частістської методології, яка тлумачить ймовірність як оцінку того, наскільки часто подія дає, що ми можемо повторити експеримент багато разів. Навпаки, байєсівська ймовірність трактується як наша ступінь переконань, що дає всі наявні попередні знання, що робить її придатною для роздумів здорового глузду про одноразові події. Експеримент із метанням кісток є повторюваним, але я вважаю дуже малоймовірним, щоб будь-який частолюбитель навмисно ігнорував вплив першого експерименту і був би таким впевненим у значущості отриманих результатів.

Хоча, здається, автор знущається над частою покладанням експериментів на повторювані експерименти та їх недовірою до пріорів, надаючи непридатність експериментальної постановки частолістській методології, я б сказав, що справжньою темою цього коміксу є не частофілістська методологія, а сліпе слідування непридатній методології взагалі. Незалежно від того, чи смішно це чи ні, для мене (але я вважаю, що це більше вводить в оману, ніж з'ясовує відмінності між двома підходами.


1
(+1) Приємним посиланням на це сильне і вирішальне припущення про повторюваність частотизму є статистичний висновок у науці (2000 р.) , Глава 1. (Хоча існує так багато питань, що важко сказати, яка з них є головною )

36
Не так швидко з повторюваністю аргументу ... По перше, експеримент , який відтворюємо є виконання запиту машини не сонце йде нова зірка Правда про те , що є фіксованою , але невідомий об'єкт логічного висновку. Експеримент із запитами, безумовно, можна повторити, і якби це було ще кілька разів, стратегія частолістів може легко здатися розумною.
кон'югатпріор

6
По-друге, у будь-якому випадку не слід бути занадто суворим у справі повторюваності, щоб ветеринари не зациклювались на тому, що взагалі нічого не могли зробити в неекспериментальних ситуаціях. Припустимо на мить, що "сонце заходить нова" було подією кандидата. Я не фізик, але мені кажуть, що подія "Сонце заходить нове" трапляється досить часто (просто не так багато тут), тому це звучить для мене як повтор. У будь-якому випадку, фолк , як Девід Кокс (в «Основи статистики») бадьоро кажуть такі речі , як: «повтори Розглянуті є майже завжди гіпотетичний . Це саме по собі видається не недоліком».
кон'югатпріор

7
Ми могли розглядати Сонце як випадкову вибірку з сукупності сонців у паралельних всесвітах, в яких ми могли б в принципі повторити експеримент, якби у нас було квантове дзеркало! ; o)
Дікран Марсупіал

2
Чому перевірка на вибух сонця не повторюється? Я перевіряю щоранку, і він ще не підірвався.
GKFX

27

Наскільки я можу побачити, що частолістський біт є розумним на сьогоднішній день:

Нехай - гіпотеза про те, що сонце не вибухнуло, а - гіпотеза. Значення р, таким чином, є ймовірністю спостереження за результатом (машина, що говорить "так") під . Якщо припустити, що машина правильно виявляє відсутність нейтрино, то якщо машина каже "так" під то це тому, що машина лежить нам в результаті прокатки двох шести. Таким чином, р-значення становить 1/36, тому, дотримуючись звичайної квазі-Фішерської наукової практики, частофіліст відкидає нульову гіпотезу на рівні 95% значущості .H 1 H 0 H 0H0H1H0H0

Але відкидання нульової гіпотези не означає, що ви маєте право прийняти альтернативну гіпотезу, тому висновок частотантів не виправданий аналізом. Тести частотних гіпотез втілюють ідею фальсифікації (подібного роду), ви не можете довести нічого правдивого, лише спростуйте. Отже, якщо ви хочете стверджувати , ви припускаєте, що є істинним, і продовжуйте лише тоді, коли зможете показати, що не відповідає даних. Однак це не означає, що є істинним, лише те, що він пережив тест і триває як життєздатна гіпотеза щонайменше, що стосується наступного тесту.H 0 H 0 H 1H1H0H0H1

Байєсиан - це просто здоровий глузд, зазначаючи, що нічого не можна втратити, зробивши ставку. Я впевнений, що періодичні підходи, коли враховуються хибнопозитивні та хибнонегативні витрати (Нейман-Пісон?), Зробили б той самий висновок, що і найкраща стратегія з точки зору довгострокового виграшу.

Підводячи підсумок: тут і частістські, і байєсовські неохайні: частолюбиві люди сліпо слідують рецепту, не враховуючи відповідного рівня значущості, помилково-позитивних / хибно-негативних витрат або фізики проблеми (тобто, не використовуючи його здоровий глузд) . Байєсівці неохайні за те, що не чітко заявляють своїх пріорів, але потім, використовуючи здоровий глузд, априори, якими він користується, явно правильні (набагато більше шансів, що машина лежить, ніж сонце насправді вибухнуло), неохайність, можливо, виправдана.


4
Відхилення нульової гіпотези просто означає, що спостереження малоймовірне, якщо б H0 було правдивим. Ви не повинні «приймати» H1 на цій основі, оскільки це в основному говорить про те, що H1 повинен бути істинним, тому що спостереження були б малоймовірними, якби H0 було правдивим. Однак спостереження також можуть бути малоймовірними у випадку H1 (який нульовий ритуал ігнорується), а H1 може бути менш імовірним, ніж H0 a-priori (який також нульовий ритуал ігнорує). Прийняття гіпотез - це слизький нахил до трактування частофілістського тесту як байєсівського тесту, який зазвичай призводить до непорозумінь у менш елементарних випадках.
Дікран Марсупіал

4
Просто натрапив на ваш коментар. І у мене те саме питання, що у @glassy. Я хотів би заперечити ваш коментар, що якщо ваші гіпотези охоплюють весь простір подій, і тут {"Сонце пішло новою", "Сонце не пішло новою"}, у мене виникають труднощі в розумінні вашої точки, як можна відкинути " Сонце пішло нове "не призводить автоматично до" НД не пішло нове ". Оголошення твердження хибним означає, що його заперечення має бути правдивим. Було б чудово, якщо ви можете надати якийсь надійний довідковий текст, де ця точка чітко пояснюється, якщо це можливо. Мені буде цікаво дізнатися більше про це.
означає , що

3
Відхилення нульової гіпотези не означає автоматично, що нульова гіпотеза, ймовірно, хибна, лише те, що розумно продовжувати альтернативну гіпотезу. Це (частково) тому, що тест частої гіпотези не враховує попередніх вірогідностей гіпотез. Більш принципово, що частістські методи не можуть бути використані для присвоєння ймовірності істинності будь-якої конкретної гіпотези, тому зв'язок між "ми можемо відкинути нульову гіпотезу" і "нульова гіпотеза, мабуть, помилкова" є цілком суб'єктивним, наскільки Я бачу.
Дікран Марсупіал

2
Це своєрідний мій погляд, рішення про те, чи приймаємо ми H1, є суб'єктивним і не є необхідним наслідком результату тесту "відмова від H0 зазвичай призводить до прийняття H1". Проблема полягає в тому, що інформація, необхідна для прийняття рішення [P (H0), P (H1), P (Z | H1)], не відображається в тесті. По суті, частина цієї інформації частково включена у встановлення порогу, але це, як правило, неповно і часто залишається невстановленим та невиправданим. Апріори все ще є в частофілістських тестах, однаково суб'єктивні, але залишаються неявними - найгірше з обох світів! ; o)
Дікран Марсупіал

3
@Dikran, я думаю, ми добре зрозуміли один одного і повинні перестати зловживати розділом коментарів, але останнє зауваження: я суб'єктивно вирішую прийняти H1, якщо суб'єктивно вирішу відхилити [амеба-відхилити] H0 на основі мого суб'єктивно вибраного на основі моя суб’єктивна експертна оцінка Р (Н1). Сказати, що "я не змушений приймати H1 лише тому, що можу амеба відхилити H0" не має жодного мовного сенсу. Але я згоден, що "я не змушений приймати H1 лише тому, що можу відхилити H0 на рівні 5%". Моя основна суть: можливість відхилити H0 на рівні 5% відхиляти . α
амеба

25

Чому цей результат здається "неправильним?" Байєсський би сказав, що результат здається протиінтуїтивним, оскільки у нас є "попередні" вірування про те, коли вибухне сонце, і доказів, наданих цією машиною, недостатньо, щоб вимити ці переконання (здебільшого через невизначеність через монета гортає). Але частофіліст здатний зробити таку оцінку, він просто повинен це робити в контексті даних, на відміну від віри.

Справжнім джерелом парадоксу є той факт, що проведене часто-статистичне тестування не враховує всіх наявних даних. У комічному аналізі немає проблем, але результат здається дивним, оскільки ми знаємо, що сонце, швидше за все, довго не вибухне. Але ЯК ми це знаємо? Тому що ми провели вимірювання, спостереження та симуляції, які можуть стримувати, коли вибухне сонце. Отже, наші повні знання повинні враховувати ці вимірювання та дані даних.

У байєсівському аналізі це робиться за допомогою цих вимірювань для побудови попереднього (хоча, процедура перетворення вимірювань у попередню недостатньо чітко визначена: в якийсь момент повинен бути початковий попередній, інакше це "черепахи все шлях вниз "). Тож, коли баєсієць використовує свою попередню, він дійсно враховує багато додаткової інформації, до якої часто не піддається аналізу р-значення частофілістів.

Таким чином, щоб залишатися на рівних умовах, повний частолістський аналіз проблеми повинен включати ті самі додаткові дані про вибух сонця, які використовуються для побудови байєсівського попередника. Але, замість того, щоб використовувати пріори, частофіліст просто розширить ймовірність того, що він використовує для включення інших вимірювань, і його р-значення буде розраховано, використовуючи цю повну ймовірність.

LL=L (Машина сказала Так | Сонце вибухнуло) * (Усі інші дані про НД | Сонце вибухнуло)L

Повний частотний аналіз, швидше за все, покаже, що друга частина ймовірності буде набагато більш обмежувальною і буде домінуючим внеском у розрахунок p-вартості (адже ми маємо багато інформації про Сонце та помилки в цій інформації маленькі (сподіваємось)).

Практично, не потрібно виходити і збирати всі дані даних, отримані за останні 500 років, щоб зробити частістський підрахунок, можна наблизити їх як простий термін вірогідності, що кодує невизначеність того, вибухнуло сонце чи ні. Потім це стане подібним до попереднього байєсівського, але філософськи дещо відрізняється, оскільки це ймовірність, тобто означає, що воно кодує якесь попереднє вимірювання (на відміну від попереднього, яке кодує деяку апріорну віру). Цей новий термін стане частиною вірогідності і буде використовуватися для побудови довірчих інтервалів (або p-значень чи будь-яких інших), на відміну від байєсівського попереднього, який інтегрований для формування достовірних інтервалів або плакатів.


1
Це має бути прийнятою або найбільш голосовою відповіддю.
Амеліо Васкес-Рейна

11

Найбільша проблема, яку я бачу, полягає в тому, що не існує статистичних даних тесту. -значення (з усіма зауваженнями, які байєвські статистики висловлюють проти нього) для значення тестової статистики визначається як (якщо припустити, що нуль відхилено для більших значень , як це було б у випадку зі статистикою , скажімо). Якщо вам потрібно прийняти рішення більш важливого значення, ви можете збільшити критичне значення і просунути область відхилення далі вгору. Ефективно, це те, що роблять кілька виправлень тестування, як Bonferroni, вказуючи вам використовувати набагато нижчий поріг дляt T P r o b [ T t | Н 0 ] Т χ 2 р 0 , 1 / 36 , 2 / 36 , ...ptTProb[Tt|H0]Tχ2p-значення. Натомість статистик-частик тут застряг із тестами розмірів на сітці .0,1/36,2/36,

Звичайно, цей "частістський" підхід є ненауковим, оскільки результат навряд чи буде відтворюваним. Після того, як Сонце переходить наднову, воно залишається надновою, тому детектор повинен постійно і знову говорити "Так". Однак повторний запуск цієї машини навряд чи знову дасть результат "Так". Це визнано в областях, які хочуть представити себе суворими і намагаються відтворити свої експериментальні результати ... що, наскільки я розумію, трапляється з вірогідністю десь між 5% (публікація оригінального документу була чистою помилкою I типу) та десь близько 30-40% в деяких галузях медицини. Люди з мета-аналізу можуть наповнити вас кращими цифрами, це лише той кайф, який час від часу наштовхується на мене через статистику виноградної статистики.

Ще однією проблемою з точки зору "належної" частотистської точки зору є те, що прокатка штампу є найменш потужним випробуванням, що має потужність = рівень значущості (якщо не нижче; 2,7% потужності для рівня значущості 5% - чим похвалитися). Теорія Неймана-Пірсона для t-тестів агонізує над тим, що вона демонструє, що це UMPT, і багато статистичної теорії високих брів (яку я ледве розумію, я повинен визнати) присвячено виведенню кривих потужностей і пошуку умов, коли дана тест є найпотужнішим у даному класі. (Подяки: @Dikran Marsupial згадав про владу в одному з коментарів.)

Я не знаю, чи це вас турбує, але баєсівський статистик тут показаний як хлопець, який не знає математики і має проблеми з азартними іграми. Правильний байєсівський статистик постулював би попереднє, обговорив його ступінь об'єктивності, отримав би заднє та продемонстрував, скільки вони дізналися з даних. Нічого цього не було зроблено, тому байєсівський процес був надто спрощений так само, як часто.

Ця ситуація демонструє класичний скринінг на проблему раку (і я впевнений, що біостатисти можуть описати це краще, ніж я міг). Під час обстеження на рідкісне захворювання з недосконалим інструментом більшість позитивних результатів виявляються помилковими. Розумні статистики це знають, і краще знають, як слідкувати за дешевими та брудними просіювачами з більш дорогими та точними біопсіями.


2
Якщо я правильно зрозумів ваш перший абзац, ви говорите, що поріг (0,05 в коміксі) встановлений занадто високим. Якби в коміксі було п'ять кубиків замість двох, чи сприймете ви поріг як низький? Як ви все-таки вирішите поріг?
ShreevatsaR

9
Я думав, що баєсовський статистик просто врахував, що шанси вибуху сонця набагато, набагато менші, ніж шанси лежати на машині (так, не обов’язково, безглуздого азартного гравця).
Джош

8
Більше того: Якщо сонце не піде на нову, переможець ставки не зможе
здати

6
Я думаю, що справа тут у тому, що статистик-частоліст слідує за рецептом, не думаючи про справжню мету аналізу. Так званий «баєсів» насправді не є баєсом, а лише тим, хто використовує здоровий глузд. У наукових журналах є чимало прикладів сліпих рецептів, саме тому мультфільм кумедний.
Дікран Марсупіал

3
Я не думаю, що відсутність тестової статистики не може бути проблемою. Тестова статистика - це лише деяка функція даних. Тож функція ідентичності, тобто тут сама дата, здавалося б, працює, принаймні в принципі.
кон'югатпріор

6

У цьому коміксі немає нічого поганого, і причина не має нічого спільного зі статистикою. Це економіка. Якщо частофіліст виявиться правильним, Земля буде непридатною для проживання протягом 48 годин. Значення 50 доларів буде фактично недійсним. Байєсийця, визнаючи це, може зробити ставку, знаючи, що його вигода в звичайному випадку становить 50 доларів, і в випадку, коли вибухнуло сонце, незначно нічого.


Це "має щось спільне зі статистикою", оскільки байєсівська статистика явно моделює це як "мінімізацію функції збитків";)
Фабіо Белтраміні

5

Тепер, коли CERN вирішив, що нейтрино не швидше світла - фронт удару електромагнітного випромінювання вдарить по землі до того, як буде помічена зміна нейтрино. Це мало б принаймні (в дуже короткому терміні) вражаючі полярні ефекти. Таким чином, факт, що темно, не завадить засвітити небо; Місяць від надмірно яскравого свічення (пор. Ларрі Нівен «Непостійний Місяць») та вражаючі спалахи, оскільки штучні супутники піддавалися випаровуванню та самозайманню.

Загалом - можливо, неправильний тест? (І хоча це можливо було раніше - не було б достатньо часу для реалістичного визначення заднього.


1
Тим більше причина відкинути гіпотезу про те, що вибухнуло сонце. :-)
ShreevatsaR

Отже, це мається на увазі в кінці статті, коли автори кажуть: "необхідні підтверджуючі дослідження"?
DWin

Власне, випадково переглянувши це, чіткий висновок є в заголовку. Машина виявляє, чи зайшло сонце нова. Немає шансів помилок у виявленні. Біт нейтрино не має значення. Враховуючи це, то статистика така, що машина відповість "ні", "ні", "ні" ... з 1/36 шансом виявитись помилковим твердженням (так), поки одноразова подія, яка припиняє статистичну процес відбувається - це також матиме 1/36 шансу помилково повідомити (ні), якщо машина запитається протягом 8-ти хвилинних інтервалів, що потрібно, щоб це стало очевидним на землі.
SimonN

4

Я погоджуюся з @GeorgeLewis, що може бути передчасно укладений підхід Частотерапевта невірний - давайте просто ще раз повторити детектор нейтрино, щоб зібрати більше даних. Не потрібно возитися з пріорами.


2

Більш простим моментом, який може бути втрачений серед усіх багатослівних відповідей тут, є те, що частоліст зображується, роблячи свій висновок на основі одного зразка. На практиці ви ніколи цього не зробите.

Досягнення обґрунтованого висновку вимагає статистично значного розміру вибірки (або іншими словами, наука повинна бути повторюваною). Тож на практиці частофіліст запускав автомат кілька разів, а потім дійшов висновку про отримані дані.

Імовірно, це спричинило б запитання машини ще одне і те ж питання ще кілька разів. І, мабуть, якщо машина помиляється лише 1 з кожні 36 разів, з’явиться чітка картина. І з цього шаблону (а не з одного читання) частоліст зробить (досить точний, я б сказав) висновок щодо того, вибухнуло чи ні сонце.


4
Що ви маєте на увазі під "статистично значущим розміром вибірки"?
Момо

@Momo - Більше ніж один зразок, це точно. Неправильно спостерігати за неможливим результатом, а потім робити висновки про те, що малоймовірне сталося, попередньо не повторюючи спостереження, щоб переконатися, що це не випадковість. Якщо ви хочете точне число, яке представляє статистично значущий розмір вибірки або алгоритм для визначення точного числа, ймовірно, статистик може надати його; але я не статистик.
близько

3
Я не думаю, що існує проблема з наявністю розміру вибірки 1, проблема полягає в тому, що тест не має статистичної потужності (тобто тест ніколи не відкине нульову гіпотезу, коли вона помилкова). Однак це виявляє проблему з тим, що "нульовий ритуал" міститься в статті, яка ігнорує питання статистичної влади (і що таке H1 насправді, або попередня інформація, що стосується проблеми).
Дікран Марсупіал

1
@Dikran Це одна з найкращих можливих відповідей! Проблема "муніципалістів" у мультфільмі полягає в тому, що певний статистичний ритуал дотримувався, не попередньо провівши необхідну оцінку властивостей тесту. (Можна навіть розширити ваш аналіз, розглядаючи, якою має бути відповідна функція втрат для цього рішення.) Як такий мультфільм акуратно шарує всіх людей, які використовують статистичні процедури, не розуміючи їх чи перевіряючи їхні припущення.
whuber

2

Відповідь на ваше запитання: "чи правильно він застосовує методологію частотистів?" ні, він не застосовує саме частолістський підхід. Значення р для цієї проблеми не є точно 1/36.

Спершу треба зазначити, що пов'язані гіпотези є

Н0: Сонце не вибухнуло,

Н1: Сонце вибухнуло.

Тоді,

p-value = P ("машина повертає так" | сонце не вибухнуло).

Щоб обчислити цю ймовірність, ми маємо зазначити, що «машина повертає так» еквівалентна «детектору нейтрино вимірює вибух Сонця І повідомляє справжній результат АБО детектор нейтрино не вимірює, як Сонце вибухає І лежить нам».

Якщо припустити, що кидання кісток не залежить від вимірювання детектора нейтрино, ми можемо обчислити р-значення, визначивши:

p0 = P ("детектор нейтрино вимірює вибух Сонця" | Сонце не вибухнуло),

Тоді р-значення дорівнює

p-значення = p0 x 35/36 + (1-p0) x 1/36 = (1/36) x (1+ 34 x p0).

Для цієї проблеми р-значення - це число між 1/36 та 35/36. Значення р дорівнює 1/36 тоді і тільки тоді, коли p0 = 0. Тобто в цьому мультфільмі приховане припущення полягає в тому, що машина детектора ніколи не вимірює вибух Сонця, якщо Сонце не вибухнуло.

Більше того, набагато більше інформації слід вкласти у ймовірність зовнішніх доказів вибуху анови.

Все найкраще.


1

Я не бачу жодних проблем з підходом частоліста. Якщо нульову гіпотезу відхилено, значення р - це ймовірність помилки типу 1. Помилка типу 1 відкидає справжню нульову гіпотезу. У цьому випадку ми маємо р-значення 0,028. Це означає, що серед усіх тестів гіпотез із цим р-значенням, що коли-небудь проводилися, приблизно 3 із сотні відкине справжню нульову гіпотезу. За будівництвом це був би один із таких випадків. Часто погоджуються, що іноді вони відкидають справжню нульову гіпотезу або зберігають помилкову нульову гіпотезу (помилки типу 2), і ніколи не заявляли про інше. Більше того, вони точно оцінюють частоту помилкових висновків у довгостроковій перспективі.

Можливо, менш заплутаним виглядом цього результату є обмін ролями гіпотез. Оскільки дві гіпотези прості, це зробити легко. Якщо нульовим є те, що сонце пішло нове, то значення р дорівнює 35/36 = 0,972. Це означає, що це не є доказом проти гіпотези про те, що сонце пішло новою, тому ми не можемо відкинути його на основі цього результату. Це здається більш розумним. Якщо ви думаєте. Чому хтось припускає, що сонце пішло новою? Я б просив тебе. Навіщо хто-небудь проводити такий експеримент, якщо сама думка про вибух сонця здається смішною?

Я думаю, що це лише показує, що треба заздалегідь оцінити корисність експерименту. Наприклад, цей експеримент був би абсолютно марним, оскільки він перевіряє те, що ми вже знаємо, просто дивлячись у небо (Я впевнений, що це значення, що фактично дорівнює нулю). Розробка хорошого експерименту - це вимога до отримання доброї науки. Якщо ваш експеримент погано розроблений, то незалежно від того, яким інструментом статистичного висновку ви користуєтесь, ваші результати навряд чи будуть корисними.


Безумовно, але байєсийці все ж можуть зробити розумний висновок із отриманими даними / результатами експерименту . Іноді ви не можете повторити експеримент або спроектувати його так, як вам хочеться.
Амеліо Васкес-Рейна

Це справедливо, байєсівський висновок може легко включати попередній досвід, що ускладнює надзвичайні результати мати статистичну вагу (Це захищає нас від статистичних потоків). Однак це також марний експеримент у байєсівських рамках. Попередній настільки сильно виступає за один висновок, що жоден результат у цьому експерименті не може його змінити. Якщо попередній настільки сильний. Навіщо проводити експеримент без шансів змінити його? Розглядаючи слабкі пріори (Можливо, це буде змінено за даними), я думаю, що методи Байєса і Частота зазвичай дають "порівнянні" результати.
Хосе Гармілья

0

Як інтегрувати «попередні знання» про стійкість до сонця у методологію частотистів?

Дуже цікава тема.

Ось лише кілька думок, а не ідеальний аналіз ...

Використання байєсівського підходу з неінформативним попереднім типово дає статистичний висновок, порівнянний з частофілістським.

Чому у байесівців є сильна попередня думка, що сонце не вибухнуло? Тому що він знає, як усі, що сонце ніколи не вибухало з його початку.

На деяких простих статистичних моделях з кон'югованими пріорами ми бачимо, що використання попереднього розподілу еквівалентно використанню заднього розподілу, отриманого від неінформативного попереднього та попереднього експериментів.

Сказане вище говорить про те, що частотант повинен зробити висновок як байєсівський, включивши в свою модель результати попередніх експериментів. Ось що насправді робить Байєс : його попереднє походить від його знань попередніх експериментів!

Nxiixiθxixi=1i=1,,N

N+1xiy={Yes}Pr(xN+1=0)θ x 1 , , x N y 1 N y = { Так } θ θθθx1,,xNy1Ny={Yes}θ. І баєсійський має намір відобразити цю інформацію через попереднє розповсюдження про .θ

З цього погляду я не бачу, як перефразовувати питання з точки зору тестування гіпотез. Прийняття не має сенсу, тому що це можливе питання експерименту в моїй інтерпретації, а не правдива / хибна гіпотеза. Можливо, це помилка Частота?H0={the sun has not exploded}


Уривок "... як він знає, що сонце ніколи не вибухнуло з його початку" приводить до відома історію про недавнє американське свято, в якому вживаються мільйони індиків ( Meleagris gallopavo ). З плином часу, кожен день будь-яка розумна індичка «знає, як усі», що її годуватимуть і доглядатимуть, аж до того доленосного (і зовсім несподіваного - для неї) дня в середині листопада! Так само наша впевненість у стабільності сонця повинна бути низькою, якби на все, на що ми мали покластися, була порівняно коротка історія спостереження людини за нею.
whuber

@whuber Я вважав за краще приватне надіслати це повідомлення. Чи існує зв’язок між вашим коментарем та темою обговорення? Я не знаю, чи саме я викликає в мене ідеї, але я вже кілька разів відчуваю, що ви коментуєте мої відповіді в основному, щоб сказати щось проти моїх відповідей. Вправа, яку ставить ОП, - це інтерпретація мультфільму, і я відчуваю, що ви критикуєте мою відповідь так, ніби я говорю про справжнє питання. Останнім часом я не оцінив і досі не розумію, чому ви викликали ймовірний «намір» за моїми відповідями.
Stéphane Laurent

Не було жодної критики, мається на увазі чи задумано: іноді коментар насправді просто ... коментар. Він намагався висвітлити (певним чином гумористично) важливі питання, натякані, але не вирішені у вашій відповіді. Мені шкода, що ви сприймаєте це як особисте, або як напад. До речі, це є реальним питанням: він просить Як інтегрувати «попередні знання» ... в методології частотної? Це питання викликає критику Юма щодо індуктивного висновку і стосується питань філософії науки, а також самих основ статистики. Варто уважно подумати!
whuber

Можливо, варто також зазначити, що значна частина вашої репутації обумовлена ​​моїми голосами за ваші відповіді - що я пропоную як вагомий доказ того, що з моєї сторони немає систематичної поведінки.
whuber

2
Ні, я зрозумів ваш коментар. Французький переклад Вашого коментаря в Google вже дивний, але, поєднуючи мої навички з англійської та дивного перекладу Google, я можу отримати правильний переклад. Я буду більше відпочивати в наступному місяці, швидше за все.
Стефан Лоран

0

Це, звичайно, часто-тестовий тест на рівні 0,05 - нульова гіпотеза відхиляється менше ніж 5% часу під нульовою гіпотезою і навіть потужність під альтернативою є великою.

З іншого боку, попередня інформація говорить нам про те, що сонце, яке заходить наднову в певний момент часу, є малоймовірним, але випадково отримати брехню випадково.

Підсумок: з комічним насправді немає нічого поганого, і це свідчить про те, що тестування неправдоподібних гіпотез призводить до високих помилок виявлення. Крім того, ви, мабуть, хочете врахувати попередню інформацію при оцінці запропонованих ставок - саме тому байєсівський задник у поєднанні з аналізом рішень настільки популярний.


-2

На мій погляд, більш правильним частотистським аналізом було б таке: H0: Сонце вибухнуло, і машина говорить правду. Н1: Сонце не вибухнуло і машина лежить.

Значення р тут = P (сонечко вибухнуло). p (машина говорить правду) = 0,97. P (вибухнуло сонце)

Статистик нічого не може зробити, не знаючи природи другої ймовірності.

Хоча ми знаємо, що P (вибухнуло сонце) дорівнює 0, тому що сонце, як зірки, не вибухає у наднови.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.