З огляду на два поглинаючі ланцюги Маркова, яка ймовірність того, що один припиниться перед іншим?


9

У мене є дві різні ланцюги Маркова, кожна з яких має один поглинаючий стан і відоме вихідне положення. Я хочу визначити ймовірність того, що ланцюг 1 досягне поглинаючого стану за менше кроків, ніж ланцюг 2.

Я думаю, що я можу обчислити ймовірність досягнення поглинаючого стану у певній ланцюжку після n кроків: з урахуванням перехідної матриці ймовірність поглинання після кроків є де - початковий стан, а - поглинаючий стан.PnPijnij

Я не впевнений, куди йти звідси, хоча. Аналогічні проблеми, які я бачив, стосуються кісток (наприклад, прокручування суми 7 до суми 8), але це простіше вирішити, оскільки ймовірність прокатки певної суми є постійною і не залежить від кількості кроків, зроблених на даний момент.

Відповіді:


13

Запускайте ланцюги паралельно. Визначте три поглинаючі стани в отриманому продуктовому ланцюжку:

  1. Перший ланцюг досягає поглинаючого стану, а другий - ні.

  2. Другий ланцюг досягає поглинаючого стану, але перший не робить.

  3. Обидві ланцюги одночасно досягають поглинаючого стану.

Обмежувальні ймовірності цих трьох станів у ланцюзі товарів дають шанси на інтерес.


Це рішення передбачає деякі (прості) конструкції. Як і в питанні, нехай бути матриця переходу для ланцюга . Коли ланцюг знаходиться в стані , дає ймовірність переходу в стан . Поглинають стану роблять перехід до самого себе з ймовірністю .P=Pij,1i,jnPiPijj1

  1. Будь-який стан може бути поглинений , замінивши рядок індикаторним вектором з позицією в .iPi=(Pij,j=1,2,,n)(0,0,,0,1,0,,0)1i
  2. Будь-який набір поглинаючих станів можна об'єднати , створивши новий ланцюг , стани якого . Матриця переходу задана черезAP/A{i|iA}{A}

    (P/A)ij={PijiA,jAkAPikiA,j=A0i=A,jA1i=j=A.

    Це дорівнює підсумовуванню стовпців відповідних і заміні рядків відповідають на один рядок, який робить перехід до себе.PAA

  3. Продукт з двох ланцюгів на станах і на станах , з переходом матриць і , відповідно, являє собою ланцюг Маркова на станах з матрицею переходуPSPQSQPQSP×SQ={(p,q)|pSP,qSQ}

    (PQ)(i,j),(k,l)=PikQjl.

    Насправді, ланцюг товарів працює двома ланцюгами паралельно, окремо відстежуючи, де є кожна, і здійснюючи переходи незалежно.


Простий приклад може прояснити ці конструкції. Припустимо, Поллі розгортає монету з шансом посадити голови. Вона планує це робити до спостереження за головами. процесу гортання монети є представляють результати останнього перевертання: для хвостів, для голів. Плануючи зупинитися на головах, Поллі застосує першу конструкцію, зробивши поглинаючим станом. Отримана матриця переходу єpSP={T,H}THH

P=(1pp01).

Він починається у випадковому стані заданому першим жеребкуванням.(1p,p)

Вчасно з Поллі Квінсі викине чесну монету. Він планує зупинитися, як тільки побачить дві голови підряд. Тому його ланцюг Маркова повинен відслідковувати попередній результат, а також поточний результат. Існує чотири такі комбінації з двох голів та двох хвостів, які я скорочу як " ", наприклад, де перша літера є попереднім результатом, а друга літера - поточним результатом. Квінці застосовує побудову (1), щоб перетворити на поглинаючий стан. Після цього він розуміє, що йому насправді не потрібні чотири стани: він може спростити свій ланцюг до трьох станів: означає, що поточний результат є хвостами, означає поточний результат - головки, іTHHHTHX означає, що останні два результати були обома головами - це поглинаючий стан. Матриця переходу є

Q=(1212012012001).

Ланцюг продуктів працює в шести станах: . Матриця переходу є тензорний добуток з і і так же легко обчислена. Наприклад, - це шанс, що Поллі здійснить перехід від до і, at в той же час (і незалежно один від одного), Квінсі робить перехід від до . Перший має шанс а останній шанс . Оскільки ланцюги запускаються незалежно, ці шанси примножуються, даючи(T,T),(T,H),(T,X);(H,T),(H,H),(H,X)PQ(PQ)(T,T),(T,H)TTTH1p1/2(1p)/2 . Повна матриця переходу є

PQ=(1p21p20p2p201p201p2p20p2001p00p0001212000012012000001).

Він знаходиться у формі блокової матриці з блоками, що відповідають другій матриці :Q

PQ=(P11QP12QP21QP22Q)=((1p)QpQ0Q).

Поллі та Квінсі змагаються, щоб побачити, хто першим досягне своєї мети. Переможцем стане Поллі кожного разу, коли вперше здійснюється перехід до де не ; переможець буде Quincy кожного разу, коли вперше здійснюється перехід до ; і якщо до того, як у будь-якого з них може статися перехід до , результатом буде нічия. Щоб відслідковувати, ми зробимо стани і обидва поглинаючі (за допомогою побудови (1)), а потім об'єднаємо їх ( через будівництво (2)). Отримана матриця переходу, упорядкована станами(H,*)*X(T,X)(H,X)(H,T)(H,H)(T,T),(T,H),(T,X),{(H,T),(H,H)},(H,X) є

R=(1p21p20p01p201p2p2p2001000001000001).

Результатами одночасного першого кидка Поллі та Квінсі будуть стани з ймовірностями відповідно: це початковий стан, в якому слід запустити ланцюг.(T,T),(T,H),(T,X),{(H,T),(H,H)},(H,X)μ=((1p)/2,(1p)/2,0,p,0)

У обмеженні як ,n

μRn11+4pp2(0,0,(1p)2,p(5p),p(1p)).

Таким чином, відносні шанси трьох поглинаючих станів (що представляють перемогу Квінсі, перемагає Поллі, вони нічия) є .(T,X),{(H,T),(H,H)},(H,X)(1p)2:p(5p):p(1p)

Малюнок

Як функція (шанс того, що будь-який кидок Поллі буде головою), червона крива описує шанс Полі на перемогу, синя крива описує шанс Квінці на перемогу, а крива золота описує шанс на нічию.p


1
Дуже акуратний приклад, дякую за це. Я все ще опрацьовую деталі, щоб побачити їх на собі. Лише питання: тут ми припустили, що дві події (кидки Поллі та Квінсі) відбуваються одночасно, наскільки велика різниця була б, якщо ми зробимо їх послідовними або навіть вибрали навмання кожного разу, хто кине наступний?
user929304

1
@ user929304 Ви отримали різні відповіді, можливо, істотно. Наприклад, припустимо, що P і Q мають ланцюг, в якій стани діляться на підмножини A і B, де всі переходи від A ідуть до B, а всі від B переходять до A. Нехай обидва починаються з станів в A. В ланцюзі товарів вони обидва одночасно чергуються між А і В, але послідовні ланцюги та випадкові вибори ламають цю інваріантну схему.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.