Як моделювати упереджену монету зі зміщенням часу?


10

Моделі упереджених монет зазвичай мають один параметр . Один із способів оцінити з серії малюнків - це використовувати попередній бета-версію та обчислити задній розподіл з вірогідністю бінома.θθ=P(Head|θ)θ

У моїх налаштуваннях через якийсь дивний фізичний процес мої властивості монети повільно змінюються і стає функцією часу . Мої дані - це набір упорядкованих малюнків, тобто . Я можу вважати, що у мене є лише один розіграш для кожного на дискретній та регулярній сітці часу.т { Н , Т , Н , Н , Н , Т , . . . } tθt{H,T,H,H,H,T,...}t

Як би ви моделювали це? Я думаю про щось на зразок фільтра Калмана, адаптованого до того, що прихована змінна є і зберігає біноміальну вірогідність. Що я можу використати для моделювання щоб зберегти висновок?P ( θ ( t + 1 ) | θ ( t ) )θP(θ(t+1)|θ(t))

Редагуйте наступні відповіді (спасибі!) : Я хотів би моделювати як Марківську ланцюжок порядку 1, як це робиться у фільтрах HMM або Kalman. Єдине припущення, яке я можу зробити, - це те, що \ theta (t) гладка. Я міг би написати P (\ theta (t + 1) | \ theta (t)) = \ theta (t) + \ epsilon з \ epsilon невеликим гауссовим шумом (ідея фільтра Калмана), але це порушить вимогу, що \ theta повинні залишатися в [0,1] . Виходячи з ідеї @J Dav, я міг би використовувати функцію probit для відображення реальної лінії в [0,1] , але я маю інтуїцію, що це дасть неаналітичне рішення. Бета-розподіл із середнім \ theta (t)θ ( t ) P ( θ ( t + 1 ) | θ ( t ) ) = θ ( t ) + ϵ ϵ θ [ 0 , 1 ] [ 0 , 1 ] θ ( t )θ(t)θ(t)P(θ(t+1)|θ(t))=θ(t)+ϵϵθ[0,1][0,1]θ(t) і ширша дисперсія могла б зробити трюк.

Я задаю це питання, оскільки маю відчуття, що ця проблема настільки проста, що її, мабуть, вивчали раніше.


Ви можете отримати оцінку, якщо у вас є модель того, як співвідношення успіху змінюється з часом. Працює багато різних моделей, і оцінки можуть сильно відрізнятися залежно від прийнятої моделі. Я не вважаю, що тяговість - це практичний критерій вибору моделі. Я хотів би зрозуміти процес і шукати модель, яка демонструє характерну характеристику, яка погоджується з поведінкою, яку ви очікуєте.
Майкл Р. Черник

@MichaelChernick: Дякую Єдине припущення, яке я можу зробити, - це те, що рухається плавно і повільно. Більше того, тяговистість є важливим критерієм, оскільки я фактично хочу поширити рішення на багатовимірний випадок з нетривіальними взаємозалежностями. Ідеальним рішенням буде аналітичне та дати оновлення оцінок параметрів у режимі он-лайн, коли надійдуть нові дані. θ
repied2

1
Чи можете ви кількісно оцінити, що ви маєте на увазі під " рухається плавно і повільно?" Цілі числа дискретні, і на цілих числах є гладкі функції, які приймають довільні значення, а це означає, що гладкість не обмежує. Деякі поняття "повільно" все ще не дають жодних обмежень, а деякі -. θ
Дуглас Заре

Як швидко йде "повільно", як зміна ймовірності 0,1 / одиниця часу або 0,001 або ... І скільки тривалої послідовності ви очікуєте мати? Чи діапазон відносно вузький (наприклад, 0,2 - 0,4) або він наближається до (0,1)?
jbowman

@DouglasZare За допомогою "гладкого" я хотів сказати, що E [θ_t + 1 | θ_t] = θ_t (або дуже близько) і VAR (θ_t + 1 | θ_t) невеликий. θ не стрибає навколо (інакше насправді нічого не можна зробити).
repied2

Відповіді:


2

Я сумніваюся, що ви можете придумати модель з аналітичним рішенням, але висновок все-таки можна зробити простежуваним за допомогою правильних інструментів, оскільки структура залежності вашої моделі проста. Як дослідник машинного навчання, я вважаю за краще використовувати наступну модель, оскільки умовивід можна зробити досить ефективним, використовуючи техніку розповсюдження очікувань:

Нехай є результатом -го випробування. Давайте визначимо параметр, що змінюється за часомtX(t)t

t 0η(t+1)N(η(t),τ2) для .t0

Щоб зв’язати з , введіть приховані змінніX ( t )η(t)X(t)

Y(t)N(η(t),β2) ,

і модель бутиX(t)

Y ( t ) 0 X ( t ) = 0 Y ( t ) P [ XX(t)=1 якщо , а іншому випадку. Ви можете фактично ігнорувати 'і маргіналізувати їх просто сказати , (з cdf з стандартний нормальний), але введення прихованих змінних робить висновок простим. Також зауважте, що у початковій параметризації .Y(t)0X(t)=0Y(t)Φ θ ( t ) = η ( t ) / βP[X(t)=1]=Φ(η(t)/β)Φθ(t)=η(t)/β

Якщо ви зацікавлені в застосуванні алгоритму висновку, погляньте на цей документ . Вони використовують дуже схожу модель, щоб ви могли легко адаптувати алгоритм. Щоб зрозуміти EP, наступна сторінка може виявитися корисною. Якщо ви зацікавлені в дотриманні цього підходу, дайте мені знати; Я можу надати більш детальну пораду щодо реалізації алгоритму висновку.


0

Для розробки мого коментаря така модель, як p (t) = p exp (-t), є простою моделлю і дозволяє оцінити p (t) шляхом оцінки p використовуючи максимальну оцінку ймовірності. Але чи справді ймовірність занепадає експоненціально. Ця модель буде явно неправильною, якщо ви спостерігаєте періоди часу з високою частотою успіху, ніж ви спостерігали в більш ранні та пізніші часи. Коливальну поведінку можна моделювати як p (t) = p | sint |. Обидві моделі дуже простежуються і їх можна вирішити з максимальною вірогідністю, але вони дають дуже різні рішення.0 0000


1
Виявляється, що ОП шукає моделювати ймовірність успіху в момент , як марковий процес, а не задавати якусь функціональну форму для . θ ( t ) θ ( t )tθ(t)θ(t)
Макрос

1
@macro має рацію, я не в змозі надати параметричну форму для , і це не бажано, оскільки ця функція може бути будь-якою гладкою. Я хочу, щоб модель Маркова порядку 1 була схожа на приховану модель Маркова або фільтр Кальмана, але з прихованою змінною, яка приймає реальні значення від 0 до 1, і з вірогідністю Бернуї. theta(t)
repied2

@pierre Добре до редагування виявилося, що ви хочете оцінити час, що змінюється, і ви просто пропонували HMM як можливий підхід. Я не рекомендував функціональну форму для способу її зміни за допомогою t. Я зазначав, що без додаткової інформації можна побудувати безліч моделей різних типів, і два мої приклади повинні були показати, що без додаткової інформації вибір варіантів може дати дуже різні відповіді. Чому б ви наполягали на НММ? Якщо хтось працював і відповідає вашим даним, то відкидайте їх, оскільки це "не аналітично"
Майкл Р. Черник,

Я припускаю, що знайти зручні рішення - це не спосіб вирішити практичні статистичні проблеми!
Майкл Р. Черник

1
@MichaelChernick Нарешті: я хотів би знайти аналітичне рішення, оскільки я сподіваюся, що це відома проблема, і люди запропонували досить гнучко аналітичне рішення. Але я погоджуюся з нашою думкою, що моделювання «реальної динаміки» важливіше, ніж обчислювальні витрати загалом. На жаль, це для великих даних, і повільний альго буде марний :-(
repied2

0

Ваша ймовірність змінюється на але, як сказав Майкл, ви не знаєте як. лінійно чи ні? Це виглядає як проблема вибору моделі, де ваша ймовірність :tp

p=Φ(g(t,θ)) може залежати від сильно нелінійної функції . - це лише обмежувальна функція, яка гарантує від 0 до 1 ймовірностей.g(t,θ)Φ

Простим дослідницьким підходом було б спробувати кілька пробітів для з різними нелінійними та виконати вибір моделі на основі стандартних інформаційних критеріїв.Φg()g()

Щоб відповісти на повторно відредаговане питання:

Як ви сказали, використання probit передбачає лише числові рішення, але замість цього ви можете використовувати логістичну функцію:

Логістична функція:P[θ(t+1)]=11+exp(θ(t)+ϵ)

Лінійна лінія:logP1P=θ(t)+ϵ

Я не впевнений, як це може працювати при підході фільтра Калмана, але все ж вважаю, що нелінійна специфікація, як або багато інших без випадкового терміна, буде виконати роботу. Як ви бачите, ця функція є "виправданою" в тому сенсі, що вона неперервна і диференційована. На жаль, додавання генерує стрибки результуючої ймовірності, чого ви не хочете, тому моєю порадою буде вийняти .ϵ ϵθ(t+1)=at3+bt2+ct+dϵϵ

Логіт імовірності:P[Coint+1=H|t]=11+exp(θ(t))

У вас уже є випадкові випадки в події bernoulli (ланцюг Маркова), і ви додаєте додаткове джерело для цього через . Таким чином, вашу проблему можна вирішити як Пробіт або Логіт, оцінені за максимальною ймовірністю зтϵt як пояснювальною змінною. Я думаю, ви погоджуєтесь, що парситинг дуже важливий. Якщо ваша основна мета - застосувати заданий метод (HMM і Kalman Filter) і не дати найпростіше дійсне рішення вашої проблеми.


Якщо ви використовуєте пробіт, багатоваріантне розширення є простим, оскільки багатоваріантний пробіт можна оцінити. Залежності будуть маніпліровані коваріаційною матрицею маючи на увазі багатоваріантне нормальне розподіл.
JDav
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.