Час, необхідний для удару по малюнку голови та хвостів у серії монеток


26

Натхненний розмовою Пітера Доннеллі в TED , в якій він обговорює, скільки часу знадобиться, щоб певна схема з'явилася в серії монет, я створив наступний сценарій у Р. Враховуючи два шаблони 'hth' і 'htt', це підраховує, скільки часу в середньому потрібно (тобто скільки викинуто монет), перш ніж потрапити на один із цих шаблонів.

coin <- c('h','t')

hit <- function(seq) {
    miss <- TRUE
    fail <- 3
    trp  <- sample(coin,3,replace=T)
    while (miss) {
        if (all(seq == trp)) {
            miss <- FALSE
        }
        else {
            trp <- c(trp[2],trp[3],sample(coin,1,T))
            fail <- fail + 1
        }
    }
    return(fail)
}

n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))

hth <- c('h','t','h')
htt <- c('h','t','t')

set.seed(4321)
for (i in 1:n) {
    trials[i,] <- c(hit(hth),hit(htt))    
}
summary(trials)

Зведена статистика така:

      hth             htt        
 Min.   : 3.00   Min.   : 3.000  
 1st Qu.: 4.00   1st Qu.: 5.000  
 Median : 8.00   Median : 7.000  
 Mean   :10.08   Mean   : 8.014  
 3rd Qu.:13.00   3rd Qu.:10.000  
 Max.   :70.00   Max.   :42.000 

У бесіді пояснюється, що середня кількість кидок монет буде різною для двох моделей; як видно з мого моделювання. Незважаючи на перегляд розмови кілька разів, я все ще не зовсім розумію, чому це було б так. Я розумію, що 'hth' перекриває себе, і інтуїтивно я думаю, що ви натиснете 'hth' швидше, ніж 'htt', але це не так. Я дуже вдячний, якби хтось міг мені це пояснити.

Відповіді:


32

Подумайте про те, що відбувається в перший раз, коли ви отримуєте Н, а за ним - T.

Випадок 1: ви шукаєте HTH , і ви бачили HT вперше. Якщо наступний жереб - H, ви закінчили. Якщо це T, ви повернетесь до першого: оскільки останні два кидки були TT, вам зараз потрібен повний HTH.

Випадок 2: ви шукаєте HTT , і ви бачили HT вперше. Якщо наступний жереб - T, ви закінчили. Якщо це H, це явно невдача; однак це незначне значення, оскільки тепер у вас є Н і потрібна лише -TT. Якщо наступним жеребкуванням є H, це робить вашу ситуацію нічим не гіршою, тоді як T робить її кращою тощо.

Поставте іншим способом, у випадку, коли 2 перший H, який ви бачите, забирає вас 1/3 шляху, і з цього моменту вам ніколи не доведеться починати з нуля. Це не вірно у випадку 1, коли TT стирає весь прогрес, який ви досягли.


О, так що в цьому сценарії гортання монети не припиняється, коли виграє один візерунок! Що має сенс. Це деякий час бентежило мене (я не дивився розмови про TED), тому я подумав, що прокоментую, щоб допомогти іншим, хто, можливо, думав про те саме.

15

Припустимо, ви монету рази і рахуєте кількість разів, коли ви бачите шаблон "HTH" (включаючи перекриття). Очікуване число - . Але це також для "HTT". Оскільки може перекривати себе, а "HTT" не може, ви очікуєте більшого скупчення з "HTH", що збільшує очікуваний час для першої появи . n n H T H H T H8н+2ннНТННТН

Ще один спосіб дивитися на це - після досягнення "HT" "T" поверне "HTH" назад до початку, тоді як "H" почне прогресувати до можливого "HTT".

кк2к2+0+8=100+0+8=8

5

Це стає гірше: у грі Пенні ви вибираєте зразок для гонки, а потім я вибираю інший. Якщо ви виберете "HTH", то я виберу "HHT" і маю шанси на виграш 2: 1; якщо ви виберете "HTT", то я виберу "HHT" ще раз і все ще маю шанси 2: 1 на мою користь. Але якщо ви виберете "HHT", то я оберу "THH" і матиму шанси 3: 1. Другий гравець завжди може змістити шанси, а найкращий вибір не є перехідним.


+1 Дякую за посилання на гру Пенні; ще безсонні ночі :)
lafrasu

Шановний Генрі, я задав подібне запитання на цьому сайті, і мені сказали шукати відповідь тут. Я переглянув гру Пенні, але все ще не можу вирішити свою проблему. Будь-яка допомога буде вдячна.
superAnnoyingUser

14

Я люблю малювати картини.

введіть тут опис зображення

Ці діаграми є автоматами кінцевого стану (FSA). Вони є крихітними дитячими іграми (на зразок жолобів та сходів ), які «розпізнають» або «приймають» послідовності HTT та HTH, відповідно, переміщуючи маркер з одного вузла в інший у відповідь на монетні гортання. Маркер починається у верхньому вузлі, вказується стрілкою (рядок i ). Після кожного кидання монети маркер переміщується по краю, позначеному результатом цієї монети (або H, або T), на інший вузол (який я буду називати відповідно "H вузлом" і "T вузлом"). Коли маркер висаджується на кінцевий вузол (відсутні вихідні стрілки, позначені зеленим кольором) гра закінчена, і FSA прийняла послідовність.

Подумайте про кожен FSA як просування по вертикалі вниз по лінійній колії. Кидання "правильної" послідовності головок і хвостів змушує маркер рухатися до місця призначення. Переміщення "неправильного" значення призводить до резервного копіювання маркера (або принаймні стоячи на місці). Маркер створює резервне копіювання до найсучаснішого стану, що відповідає останнім кидкам. Наприклад, HTT FSA у лінії ii залишається поставленою на лінії ii , побачивши голову, оскільки ця голова може бути початковою послідовністю можливої ​​HTH. Це не зовсім назад до початку, адже це фактично взагалі ігнорує цю останню голову.

Після перевірки цих двох ігор справді відповідають HTT та HTH, як заявлено, та порівнюючи їх по черзі, і тепер має бути очевидним, що HTH перемогти важче . Вони відрізняються за своєю графічною структурою лише у рядку iii , де H повертає HTT до рядка ii (а T приймає), але, у HTH, T повертає нас назад до лінії i (і H приймає). Штраф у рядку iii при грі на HTH суворіший, ніж штраф у грі HTT.

Це можна кількісно оцінити. Я позначив вузли цих двох FSA з очікуваною кількістю викидів, необхідних для прийняття. Назвемо цей вузол "значеннями". Маркування починається з

(1) запис очевидного значення 0 на приймаючих вузлах.

Нехай вірогідність голів буде p (H), а ймовірність хвостів - 1 - p (H) = p (T). (Для справедливої ​​монети обидві ймовірності дорівнюють 1/2.) Оскільки кожен фліп монети додає один до кількості кидок,

(2) значення вузла дорівнює одному плюс p (H) кратному значенню вузла H плюс p (T), кратному значенню вузла T.

Ці правила визначають значення . Це швидка та інформативна вправа, щоб перевірити правильність маркованих значень (якщо вважати справедливою монету). Як приклад, розглянемо значення для HTH у рядку ii . Правило говорить, що 8 повинно бути на 1 більше, ніж в середньому 8 (значення вузла H у лінії i ) та 6 (значення вузла T у рядку iii ): досить впевнено, 8 = 1 + (1/2) * 8 + (1/2) * 6. Ви можете так само легко перевірити решту п’яти значень на ілюстрації.


Підхід FSA - це чудовий спосіб аналізу гри Пенні (у відповіді від @Henry). Значення позначаються дещо інакше: тепер FSA має один приймаючий вузол на шаблон. Щоб знайти шанс перемоги вашого шаблону, позначте його приймаючий вузол з 1, а всі інші приймаючі вузли - 0. Значення в будь-якому іншому вузлі дорівнює середньому значенню його вузлів H і T. Значення (унікального) стартового вузла - це шанс на перемогу.
whuber

0

@gung Дякую, що це зробив. Я зафіксував приклад. Однак на малюнку є помилка
друку

4

Деякі чудові відповіді. Я хотів би трохи поступити і вирішити питання про контр-інтуїтивність. (Я цілком згоден, BTW)

Ось як я це розумію. Уявіть стовпчик випадкових послідовних результатів викидання монет, надрукованих на паперовій стрічці, що складається з літер «Н» та «Т».

Довільно відірвіть ділянку цієї стрічки та зробіть ідентичну копію.

На даній стрічці послідовність HTH та послідовність HTT будуть виникати так само часто, якщо стрічка досить довга.

Але іноді випадки HTH працюватимуть разом, тобто HTHTH. (або навіть дуже зрідка HTHTHTH)

Це накладення не може трапитися із випадками HTT.

За допомогою маркера виберіть "смужки" успішних результатів, HTH на одній стрічці та HTT на іншій. Кілька смуг HTH будуть коротшими через перекриття. Отже, проміжки між ними, в середньому, будуть трохи довші, ніж на іншій стрічці.

Це трохи схоже на очікування автобуса, коли в середньому є один кожні п’ять хвилин. Якщо автобусам дозволено перекриватись один одного, інтервал буде в середньому трохи більшим, ніж п’ять хвилин, тому що десь два пройдуть мимо разом.

Якщо ви приїдете в довільний час, ви будете чекати трохи довше на наступний (для вас перший) автобус, в середньому, якщо їм дозволяється перекриватися.


2

Я шукав інтуїцію до цього в цілому випадку (як я розбираюсь через Intro Росса до Моделей ймовірності). Тому я думав про цілі випадки. Я виявив, що це допомогло:

А

Б

А=БП(АБ~)=0

АБП(АБ~)0

Отже, дозвольте собі уявити, що у мене є шанс закінчити візерунок на наступному розіграші. Я малюю наступний символ, і він не закінчує візерунок. У випадку, якщо мій візерунок не перетинається, намальований символ все ще може мені дозволити знову починати будувати шаблон.

У випадку перекриття символ, який мені потрібен, щоб закінчити свій частковий візерунок, був таким самим, як і символ, який мені знадобиться для початку перебудови. Тому я не можу зробити жодного з них, і тому, безумовно, потрібно буде дочекатися наступного розіграшу, щоб мати можливість почати будівництво заново.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.