Чому люди використовують p-значення замість обчислення ймовірності моделі даних?


43

Грубо кажучи, р-значення дає ймовірність спостережуваного результату експерименту з урахуванням гіпотези (моделі). Маючи цю ймовірність (p-значення), ми хочемо судити про нашу гіпотезу (наскільки це ймовірно). Але хіба не було б природніше обчислити ймовірність гіпотези з огляду на спостережуваний результат?

Більш детально. У нас є монета. Ми перевертаємо це 20 разів і отримуємо 14 голів (14 з 20 - це те, що я називаю "результатом експерименту"). Тепер наша гіпотеза полягає в тому, що монета справедлива (ймовірності голови та хвоста рівні одна одній). Тепер обчислюємо p-значення, яке дорівнює ймовірності отримати 14 і більше голів за 20 фліп монети. Гаразд, зараз у нас є ця ймовірність (0,058), і ми хочемо використовувати цю ймовірність, щоб судити про нашу модель (наскільки це ймовірно, що у нас є справедлива монета).

Але якщо ми хочемо оцінити ймовірність моделі, чому б ми не обчислили ймовірність моделі, що дається експерименту? Чому ми обчислюємо ймовірність експерименту за даною моделлю (p-значення)?


Вам все одно доведеться якось моделювати свій експеримент, щоб можна було обчислити ймовірність функції.
Раскольников

11
Піт Діксон написав статтю ще в 1998 році під назвою "Чому вчені цінують р-значення" ( psychonomic.org/backisissue/1631/R382.pdf ), яка може бути інформативним прочитанням. Хорошим підсумком може стати документ Glover & Dixon 2004 року про коефіцієнт ймовірності як метрики заміщення ( pbr.psychonomic-journals.org/content/11/5/791.full.pdf ).
Майк Лоуренс

2
Майк, це підозріло схоже на гарну відповідь для мене. Що це робить у коментарях?
Метт Паркер

John D Кук опублікував відмінний відповідь на моє запитання, який я думаю , що ви знайшли б цікаво: stats.stackexchange.com/questions/1164 / ...
Дуг

Люди не використовують p-значень, як це роблять статистики. (Не могла протистояти прикметному висловлюванню, що теж правда. Звичайно, щойно ви почнете правильно кваліфікувати кожен іменник, він втрачає свою жалість.)
Уейн

Відповіді:


31

Обчислення ймовірності правильності гіпотези не вписується в рамках частолістського визначення ймовірності (довгострокова частота), яке було прийнято, щоб уникнути передбачуваної суб'єктивності байєсівського визначення ймовірності. Істинність певної гіпотези не є випадковою змінною, вона є або правдою, або не є, і не має довгострокової частоти. Дійсно цікавіше зацікавитись вірогідністю істинності гіпотези, що є ІМХО, чому р-значення часто неправильно трактуються як ймовірність того, що нульова гіпотеза є істинною. Частина труднощів полягає в тому, що з правила Байєса ми знаємо, що для обчислення задньої ймовірності того, що гіпотеза є істинною, потрібно почати з попередньої ймовірності того, що гіпотеза є істинною.

Байєсівський розрахував би ймовірність того, що гіпотеза правдива, враховуючи дані (та його попереднє переконання).

По суті, у вирішенні між часто-частістським та баєсівським підходами є вибір, чи є передбачувана суб'єктивність байєсівського підходу більш огидною, ніж той факт, що частофілістський підхід взагалі не дає прямої відповіді на питання, яке ви насправді хочете задати - але є місце для і те й інше.

У випадку запитання, чи монета справедлива, тобто ймовірність голови дорівнює ймовірності хвоста, у нас також є приклад гіпотези, про яку ми знаємо, що в реальному світі з самого початку є майже неправдивою. Дві сторони монети несиметричні, тому слід очікувати незначної асиметрії у ймовірності голови та хвостів, тому якщо монета "пройде" тест, це просто означає, що ми не маємо достатньо спостережень, щоб мати можливість зробіть висновок про те, що ми вже знаємо, що є правдою - що монета дуже злегка упереджена!


4
Насправді більшість монет насправді дуже близькі до справедливих, і важко придумати фізично правдоподібний спосіб їх дуже змістити
Бен Болкер

8
Бути дуже близько до ярмарку - це не те саме, що бути точно справедливим, що є нульовою гіпотезою. Я вказував на одну з ідіосинкразій тестування гіпотез, а саме на те, що ми часто знаємо, що нульова гіпотеза помилкова, але все одно її використовуємо. Більш практичний тест має на меті виявити, чи є докази того, що монета значно упереджений, а не значні докази того, що монета є упередженою.
Дікран Марсупіал

1
Привіт, можливо, я помиляюся, але я думав, що в науці ви ніколи не можете сказати, що альтернативна гіпотеза є правдою, ви можете сказати лише, що нульова гіпотеза відхилена, і ви приймаєте альтернативну гіпотезу. Для мене значення p відображає шанс, що ви зробите помилку типу 1, тобто ви відкинете альтернативну гіпотезу і приймете нульову гіпотезу (скажімо, p = .05 або 5% часу. Важливо розрізняти тип 1 помилка та помилка типу 2 та роль, яку відіграє влада у моделюванні подій.
user2238,

3
Для тестів, що проводяться в періодичному періоді, я б використовував ще більш слабке твердження, яке полягає в тому, що ви або "відкидаєте нульову гіпотезу", або "не вдається відкинути нульову гіпотезу", і нічого не приймаєте. Ключовим моментом є те, що (як і у випадку з упередженою монетою) іноді ви априорі знаєте, що нульова гіпотеза не відповідає дійсності, у вас просто не вистачає даних, щоб продемонструвати, що це неправда; в такому випадку було б дивно "прийняти" це. Часті тести мають коефіцієнти помилок типу I та II, але це не означає, що вони можуть говорити про ймовірність того, що певна гіпотеза є істинною, як в ОП.
Дікран Марсупіал

2
@ user2238 Значення р - це ймовірність помилки I типу лише тоді, коли нульова гіпотеза є "простою" (а не складовою) і вона справді відповідає дійсності. Наприклад, в односторонньому тесті на те, чи є монета упередженою у напрямку до хвостів ( ), використання двоголової монети гарантує, що ймовірність помилки типу I дорівнює нулю, хоча значення p від будь-який кінцевий зразок буде нульовим. H0:p<0.5
whuber

18

Нічого подібного до відповіді на справді старе питання, але ось ...

p-значення - майже достовірні тести гіпотез. Це дещо адаптований напрямок, узятий із книги теорії ймовірностей Jaynes 2003 (Повторювані експерименти: ймовірність та частота). Припустимо, у нас є нульова гіпотеза яку ми хочемо перевірити. У нас є дані і апріорної інформації . Припустимо, існує деяка не визначена гіпотеза , якої ми перевіримо . Відношення коефіцієнта задніх коефіцієнтів для проти дається: D I H A H 0 H A H 0H0DIHAH0HAH0

P(HA|DI)P(H0|DI)=P(HA|I)P(H0|I)×P(D|HAI)P(D|H0I)

Тепер перший член праворуч не залежить від даних, тому дані можуть впливати на результат лише через другий доданок. Тепер ми завжди можемо винайти альтернативну гіпотезу таку, що - гіпотеза "ідеального пристосування". Таким чином, ми можемо використовувати як міру того, наскільки добре дані можуть підтримувати будь-яку альтернативну гіпотезу щодо нуля. Не існує альтернативної гіпотези, що дані можуть підтримувати більше, ніж . Ми також можемо обмежити клас альтернатив, і зміна полягає в тому, що замінюється на максимальну ймовірність (включаючи нормалізуючі константи) в межах цього класу. ЯкщоHAP(D|HAI)=11P(D|H0I)H01P(D|H0I)1P(D|H0I)починає ставати занадто малим, тоді ми починаємо сумніватися в нульовій, тому що кількість альтернатив між і зростає (включаючи деякі з попередньою незначною). Але це дуже майже те, що робиться з p-значеннями, але, за винятком, ми не обчислюємо ймовірність для деякої статистики та якоїсь "поганої" області статистики. Ми обчислюємо ймовірність для - інформації, яку ми насправді маємо, а не якоїсь її підмножини, .H0HAt(D)>t0t(D)Dt(D)

Ще одна причина, по якій люди використовують р-значення, полягає в тому, що вони часто складають "правильний" тест гіпотез, але їх можна легше підрахувати. Ми можемо показати це на дуже простому прикладі тестування нормальної середньої з відомою дисперсією. У нас є дані з припущеною моделлю (частина попередньої інформації ). Ми хочемо перевірити . Тоді ми, після невеликого розрахунку:D{x1,,xN}xiNormal(μ,σ2)IH0:μ=μ0

P(D|H0I)=(2πσ2)N2exp(N[s2+(x¯μ0)2]2σ2)

Де і . Це показує, що максимальне значення буде досягнуто, коли . Максимальне значення:x¯=1Ni=1Nxis2=1Ni=1N(xix¯)2P(D|H0I)μ0=x¯

P(D|HAI)=(2πσ2)N2exp(Ns22σ2)

Отже, ми беремо співвідношення цих двох, і отримуємо:

P(D|HAI)P(D|H0I)=(2πσ2)N2exp(Ns22σ2)(2πσ2)N2exp(Ns2+N(x¯μ0)22σ2)=exp(z22)

Де - це "Z-статистика". Великі значенняставить під сумнів нульову гіпотезу щодо гіпотези про нормальну середню, яка найбільш сильно підтримується даними. Ми також можемо побачити, що є єдиною необхідною частиною даних, і тому є достатньою статистикою для тесту.z=Nx¯μ0σ|z|x¯

Р-ціннісний підхід до цієї проблеми майже однаковий, але зворотний. Почнемо з достатньої статистики і обчислимо її розподіл вибірки, який легко показано - де я використав велику літеру, щоб відрізнити випадкову змінну від спостережуваного значення . Тепер нам потрібно знайти область, яка ставить під сумнів нульову гіпотезу: це легко видно, що це ті регіони, девеликий. Тож ми можемо обчислити ймовірність того, щоx¯X¯Normal(μ,σ2N)X¯x¯|X¯μ0||X¯μ0||x¯μ0|як міра того, наскільки далекі спостережувані дані від нульової гіпотези. Як і раніше, це простий розрахунок, і ми отримуємо:

p-value=P(|X¯μ0||x¯μ0||H0)
=1P[N|x¯μ0|σNX¯μ0σN|x¯μ0|σ|H0]
=1P(|z|Z|z||H0)=2[1Φ(|z|)]

Тепер ми можемо бачити, що р-значення є монотонною спадною функцією, це означає, що ми, по суті, отримуємо таку ж відповідь, як і тест на "правильну" гіпотезу. Відхилення, коли значення p нижче певного порогу - це те саме, що і відхилення, коли задні шанси перевищують певний поріг. Однак зауважте, що, роблячи належний тест, нам довелося визначити клас альтернатив, і нам довелося максимізувати ймовірність над цим класом. Для p-значення ми повинні знайти статистику та обчислити її розподіл вибірки та оцінити це за спостережуваним значенням. У певному сенсі вибір статистики рівнозначний визначенню альтернативної гіпотези, яку ви розглядаєте.|z|

Хоча в цьому прикладі обидві речі прості, але у складніших випадках вони не завжди такі легкі. У деяких випадках може бути простіше вибрати правильну статистику для використання та обчислити її розподіл вибірки. В інших може бути простіше визначити клас альтернативних варіантів і максимізувати його над цим класом.

Цей простий приклад пояснює велику кількість тестування, заснованого на p-значенні, просто тому, що так багато гіпотезних тестів є "приблизним нормальним" різноманіттям. Він дає приблизну відповідь і на вашу проблему монети (використовуючи звичайне наближення до двочленного). Це також показує, що значення p в цьому випадку не зведе вас з глузду, принаймні, з точки зору тестування єдиної гіпотези. У цьому випадку можна сказати, що р-значення є мірою доказів проти нульової гіпотези.

Однак р-значення мають менш інтерпретаційну шкалу, ніж коефіцієнт Байєса - зв’язок між р-значенням та "кількістю" доказів проти нуля є складним. p-значення занадто швидко стають занадто малими - це ускладнює їх правильне використання. Вони, як правило, завищують підтримку проти нуля, наданого даними. Якщо інтерпретувати значення p як вірогідність проти нуля - у формі шансів дорівнює , коли фактичні докази - , а у формі шансів - коли фактичні докази - . Або кажучи іншим способом, використовуючи значення p як імовірність того, що нуль тут помилковий, еквівалентно встановленню попередніх коефіцієнтів. Так для р-значення0.193.870.05196.830.1попередні маються на увазі попередні шанси проти нуля - а для p-значення - маються на увазі попередні шанси проти нуля - .2.330.052.78


4
+1. "... вибір статистики рівнозначний визначенню альтернативної гіпотези, яку ви розглядаєте", вражає мене глибоким розумінням.
whuber

Хороша відповідь. Варто зазначити (хоча очевидно), що робота з класом альтернатив, який перевищує для якогось невеликого часто може бути обчислювально забороняючим, не кажучи вже про те, якщо доводиться працювати з нескінченною чи незліченною кількістю альтернатив, що також може статися на практиці. Великий плюс підходу p-значення полягає в тому, що він часто (як правило?) Обчислювально простий / простежується. kkk
Faheem Mitha

1
@ faheemmitha - ви маєте рацію щодо комбінаторного вибуху, проте це не відбувається для описаного нами підходу (адже ви можете показати, що підхід Байєса ефективно визначає залишки). Це тому, що нам потрібно лише визначити клас, а потім максимізувати. Нам не потрібно оцінювати кожну альтернативу, просто знайти найкращу.
ймовірністьлогічний

Чому на це відповідає відповідь Wiki Wiki?
Амеба каже: Поновіть Моніку

10

Як колишній академік, який перейшов на практику, я зроблю знімок. Люди використовують р-значення, оскільки вони корисні. Ви не бачите цього в підручникових прикладах монетних переворотів. Впевнені, що вони насправді не є твердими фундаментально, але, можливо, це не так потрібно, як ми любимо думати, коли ми думаємо академічно. У світі даних нас оточує буквально нескінченна кількість можливих речей, які слід переглянути далі. За допомогою обчислень p-значення все, що вам потрібно, - уявлення про те, що нецікаво, і чисельне евристичне для того, які дані можуть бути цікавими (ну, плюс модель ймовірності для нецікавих). Тоді окремо або спільно ми можемо сканувати речі досить просто, відкидаючи масу нецікавих. Значення р дозволяє нам сказати: "Якщо я не ставлю особливого пріоритету на те, щоб думати про це інакше,


10

Ваше запитання є прекрасним прикладом частолістських міркувань і насправді цілком природно. Цей приклад я використовував у своїх класах, щоб продемонструвати характер тестів гіпотез. Я прошу волонтера передбачити результати гортання монети. Незалежно від результату, я записую "правильну" здогадку. Ми робимо це неодноразово, поки клас не стане підозрілим.

Тепер вони мають нульову модель в голові. Вони припускають, що монета справедлива. Зважаючи на те, що припущення на 50% правильне, коли все справедливо, кожна наступна правильна здогадка викликає більше підозр, що модель справедливої ​​монети є неправильною. Кілька правильних здогадок, і вони приймають роль випадковості. Після 5 або 10 правильних здогадок клас завжди починає підозрювати, що шанс на справедливу монету низький. Таким чином, це є з характером тестування гіпотез за частолістською моделлю.

Це чітке та інтуїтивне уявлення про те, що часто проводять тестування гіпотез. Це ймовірність спостережуваних даних з огляду на те, що нуль відповідає дійсності. Це насправді цілком природно, як продемонстрував цей простий експеримент. Ми сприймаємо як належне, що модель становить 50-50, але, як свідчать докази, я відкидаю цю модель і підозрюю, що є щось інше.

Отже, якщо ймовірність того, що я спостерігаю, низька, враховуючи модель, яку я припускаю (р-значення), то я маю певну впевненість у відхиленні передбачуваної моделі. Таким чином, р-значення є корисним показником доказів проти моєї припущеної моделі з урахуванням ролі випадковості.

Відмова від відповідальності: я взяв цю вправу з давно забутої статті, в якій я пам’ятаю, був одним із журналів ASA.


Бретт, це цікавий і чудовий приклад. Мені здається, модель в тому, що люди очікують, що порядок головок і хвостів відбуватиметься випадковим чином. Наприклад, якщо я бачу 5 підрядів підряд, я роблю висновок, що це приклад випадкового процесу. Насправді, і я можу помилятися тут, ймовірність виникнення тоїнових косів (якщо припустити випадковість) становить 50% голів та 50% хвостів, і це абсолютно не залежить від попереднього результату. Справа в тому, що якщо ми кинули монету 50000 разів, а перші 25000 були головами, за умови, що решта 25000 були хвостами, це все одно відображає відсутність упередженості
користувач2238

@ user2238: Ваше останнє твердження вірно, але це буде надзвичайно рідко. Насправді, побачити пробіг 5 голів у 5 кидках трапилося б лише 3% часу, якщо монета справедлива. Завжди можливо, що нуль справжній, і ми стали свідками рідкісної події.
Бретт

6

"Грубо кажучи, p-значення дає ймовірність спостережуваного результату експерименту з урахуванням гіпотези (моделі)."

але це не так. Навіть орієнтовно - це невід'ємна відмінність.

Модель не вказана, як вказує Раскольников, але припустимо, ви маєте на увазі біноміальну модель (незалежні кидки монети, виправлені невідомі зміщення монети). Гіпотеза - це твердження, що відповідний параметр у цій моделі, зміщення або ймовірність голов, становить 0,5.

"Маючи цю ймовірність (p-значення), ми хочемо судити про нашу гіпотезу (наскільки це ймовірно)"

Ми можемо хотіти зробити це судження, але значення p не допоможе (і не було розроблено) для цього.

"Але хіба не було б природніше обчислити ймовірність гіпотези, враховуючи спостережуваний результат?"

Можливо, це було б. Дивіться всю дискусію Байєса вище.

"[...] Тепер ми обчислюємо p-значення, яке дорівнює ймовірності отримати 14 і більше голів за 20 обертів монети. Добре, тепер у нас є ця ймовірність (0,058), і ми хочемо використати цю ймовірність для судіть про нашу модель (наскільки ймовірно, що у нас є чесна монета) ".

"нашої гіпотези, припускаючи, що наша модель є правдивою", але по суті: так. Великі p-значення вказують на те, що поведінка монети відповідає гіпотезі про справедливість. (Вони, як правило, відповідають тому, що гіпотеза є помилковою, але настільки близька до істинності, що нам не вистачає даних, щоб сказати; див. "Статистична потужність".)

"Але якщо ми хочемо оцінити ймовірність моделі, чому ми не обчислюємо ймовірність моделі за даним експериментом? Чому ми обчислюємо ймовірність експерименту за даною моделлю (p-значення)?"

Ми фактично не обчислюємо ймовірність експериментальних результатів з урахуванням гіпотези в цій установці. В кінці кінців, ймовірність становить лише близько 0,176 бачити рівно 10 голів , коли гіпотеза вірна, і це найбільш ймовірне значення. Це взагалі не велика зацікавленість.

Також важливо, що ми зазвичай не оцінюємо ймовірності моделі. І відповіді частофілістів, і баєсів, як правило, припускають, що модель є правдивою і роблять свої умовиводи щодо її параметрів. Дійсно, не всі Bayesians б навіть в принципі бути зацікавлені в ймовірності моделі, тобто: ймовірність того, що вся ця ситуація була добре моделюється біноміального розподілу. Вони можуть зробити багато перевірки моделі, але ніколи насправді не запитуйте, наскільки ймовірний біноміал у просторі інших можливих моделей. Байєсів, які дбають про Фактори Байєса, цікавлять інші, не так вже й багато.


2
Хм, два голоси проти. Якщо відповідь настільки погана, було б добре зауважити.
кон'югатприор

Мені сподобалась ця відповідь. Іноді люди вниз голосують, тому що це не схоже на підручник і намагаються позбавити всіх сайтів дискусій, що містять талант здорового глузду або мирян, як опис.
Вас

Я не заявив, але я думаю, що проблема полягає в тому, що ваша думка не зрозуміла.
Елвіс

6

Побічна примітка до інших відмінних відповідей: іноді бувають випадки, коли ми цього не робимо. Наприклад, до недавнього часу вони були прямо заборонені в журналі " Епідеміологія" - тепер вони просто "сильно відсторонені", і редакція приділяла величезну кількість дискусії про них тут: http: //journals.lww. com / epidem / сторінки / collectiondetails.aspx? TopicalCollectionId = 4


3

Я додам лише кілька зауважень; Я згоден з вами, що надмірне використання -значень шкідливо.p

  • Деякі люди у застосованій статистиці неправильно трактують -значення, зокрема розуміючи їх як ймовірність того, що нульові гіпотези є істинними; cf ці документи: P Значення - це не ймовірність помилок, і чому ми не знаємо, що означає "статистична значимість": велика невдача в освіті .p

  • Інша поширена помилкова думка полягає в тому, що -значення відображають розмір виявленого ефекту або їх потенціал для класифікації, коли вони відображають як розмір вибірки, так і розмір ефектів. Це змушує деяких людей писати документи, щоб пояснити, чому змінні, які були показані "сильно пов'язаними" з персонажем (тобто з дуже малими значеннями p), є поганими класифікаторами, як цей ...p

  • На закінчення, моя думка, що -значення настільки широко використовуються через стандарти публікацій. У прикладних районах (біостати ...) їх розмір іноді є винятковою турботою деяких рецензентів.p


2

Визначте ймовірність . Я мав це на увазі. Перш ніж ми прогресуємо далі, нам потрібно погодитися на умовах.

Інтуїтивне визначення ймовірності - це міра невизначеності. Ми не впевнені, чи підуть наступні викиди монети голови чи хвости. Тобто невизначеність в даних . Ми також не впевнені, справедлива чи ні монета. Це невизначеність щодо моделі ... або ви можете назвати невизначеність щодо стану світу.DM

Щоб дійти до умовного розподілу , вам потрібно мати спільний розподіл - тобто знання всього населення монет, що знаходяться в обігу, скільки з них підроблено та як підроблені монети ведуть себе (що може залежати від способу кручення монет і попадання їх у повітря).P(M|D)P(M,D)

У конкретному прикладі монет це, принаймні, концептуально можливо - урядові цифри доступні на монетах, які повинні бути справедливими (28 10 9 на рік), або принаймні тих, що мають стабільні характеристики. Що стосується підроблених монет, про масштаби виробництва менше мільйона, ймовірно, не варто говорити, тому може бути ймовірністю того, що монета, яку ви отримали з реєстру касира, є несправедливою. Тоді вам потрібно придумати модель того, як працює несправедлива монета ... і отримати спільне розповсюдження та стан даних.106/28109

У практичному світі проблеми, пов'язані з медичними станами та способом їх роботи, ви, можливо, не зможете придумати жоден із цих компонентів спільного розповсюдження, і не зможете це спричинити.

Байєсова моделювання забезпечує більш спосіб спростити моделі і придумати ці суглоби . Але чорт у деталях. Якщо ви скажете, що справедлива монета - одна з , а потім вкажіть і вкажіть традиційну попередню версію бета-версії та отримайте кон'югат Beta posterior, то ... сюрприз, сюрприз! для будь-якого з цих безперервних розподілів, незалежно від того, чи є ваш попередній або . Отже, вам доведеться включити точкову масу в , надати їй попередню масу (P(M,D)p=0.5P(p=0.5)=0B(0.5,0.5)B(1000,1000)0.528109/(28109+106), скажімо), і подивіться, чи ваші дані відсуваються задньою від цієї маси точок. Це більш складний розрахунок, який передбачає відбір проб Метрополіс-Гастінгса, а не більш традиційний відбір Гіббса.

Крім труднощів говорити про те, що саме є правильними моделями, методи Байєса мають обмежені способи боротьби з неправильним визначенням моделі. Якщо вам не подобаються гауссові помилки або ви не вірите в незалежність монетних кидок (ваша рука втомлюється після перших 10 000 або більше кидок, тому ви не кидаєте її так високо, як перші 1000 або більше разів, що може вплинути на ймовірності), все, що ви можете зробити в байєсському світі, - це побудувати більш складну модель - пріори розбивання паличок для звичайних сумішей, розбиття ймовірностей з часом, що завгодно. Але немає прямого аналога до стандартних помилок сендвіч Губера, які прямо підтверджують, що модель може бути неправильно уточнена, і вони готові враховувати це.

Повертаючись до мого першого абзацу - ще раз визначте ймовірність. Формальне визначення - тріо . - це простір можливих результатів (комбінації моделей та даних). - -алгебра того, що можна виміряти на цьому просторі. - міра / щільність ймовірності, приєднана до підмножини , - які повинні бути виміряні для математики ймовірності роботи. У кінцевих розмірах більшість розумних множин вимірюються - див. Множини Бореля<Ω,F,P>ΩFσPAΩAF, Я не збираюся набридати вам деталями. Наприклад, з цікавішими нескінченними просторами (наприклад, криві та траєкторії) речі дуже швидко зачісуються. Якщо у вас є випадковий процес на одиничний інтервал часу, то безліч є НЕ вимірні, незважаючи на уявну простоту . (Набори на зразок вимірюються для кінцевих , і насправді генерують необхідну -алгебру. Але цього недостатньо, мабуть .) Отже, ймовірності у великих розмірах можуть бути складними навіть на рівні визначень, не кажучи вже про обчислення.Xt,t[0,1]{Xt>0,t[0,0.5]}{Xt>0,t{t1,t2,,tk}}kσ


1

Але якщо ми хочемо оцінити ймовірність моделі, чому б ми не обчислили ймовірність моделі, що дається експерименту?

Тому що ми не знаємо як. Можлива нескінченна кількість моделі, і їх вірогідний простір не визначений.

Ось практичний приклад. Скажімо, я хочу прогнозувати ВВП США. Я отримую часовий ряд і підходять до моделі. Яка ймовірність, що ця модель справжня?

Отже, давайте насправді вписуємо випадкову модель прогулянки у ряд ВВП: де - темп зростання, а - випадкова помилка. Мій код нижче робить саме це, і він також виробляє прогноз (червоний) і порівнює його історичні дані (синій). μ e t

Δlnyt=μ+et
μet

введіть тут опис зображення

Однак хто сказав, що ВВП - це випадковий процес прогулянки? Що це за трендовий процес? Отже, підходимо до тенденції: де - нахил тенденції часу. Прогноз за допомогою тренд-моделі відображається на тому ж графіку (жовтий). c

lnyt=ct+et
c

Тепер, як би ви обчислили ймовірність того, що моя модель випадкової прогулянки справжня? В межах MLE ми могли б обчислити ймовірність дрейфу за даними набору даних, але це не ймовірність. По-друге, і що ще важливіше, як би ви обчислили ймовірність того, що модель є випадковим кроком з цим дрейфом, знаючи, що це також може бути трендовою моделлю? Це може бути будь-яка інша кількість моделей, які виробляють подібну динаміку.μ

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.