Поясніть, будь ласка, парадокс очікування


75

Кілька років тому я створив детектор випромінювання, який працює, вимірюючи інтервал між подіями, а не рахуючи їх. Моє припущення полягало в тому, що при вимірюванні неспоріднених проб я в середньому вимірював половину фактичного інтервалу. Однак, коли я тестував схему з каліброваним джерелом, показник був надмірним у два рази, що означало, що я вимірював повний інтервал.

У старій книзі про ймовірність та статистику я знайшов розділ про щось, що називається "Парадокс очікування". У ньому подано приклад, коли автобус прибуває на зупинці кожні 15 хвилин, а пасажир прибуває навмання, він зазначає, що пасажир в середньому чекатиме цілих 15 хвилин. Я ніколи не зміг зрозуміти математику, подану на прикладі, і продовжую шукати пояснення. Якщо хтось може пояснити, чому так, щоб пасажир чекав повний інтервал, я буду краще спати.


1
Яка назва та хто автор книги? Чи можете ви скопіювати приклад слово в слово тут?
Джоель Рейєс Ноче

Це не моя спеціальність, але парадокс, який згадується в ОП, такий самий, як і парадокс інспекції ?
Джоель Рейєс Ноче

1
Пов’язаний пост: math.stackexchange.com/questions/222674/…
ddiez

1
Здається, моя здогадка вище має певну підтримку. У коментарі до цієї відповіді згадується парадокс інспекції.
Joel Reyes Noche

2
Я думаю, що використання шини як аналогія заплутане, оскільки автобуси, як правило, дотримуються графіків. Замість цього подумайте, скільки часу займе порожнє таксі, коли в середньому приїжджає кожні 15 хвилин.
Харві Мотульський

Відповіді:


48

Як зазначив Glen_b, якщо автобуси приїжджають кожні хвилин без будь-якої невизначеності , ми знаємо, що максимально можливий час очікування - хвилин. Якщо з нашого боку ми приїдемо «навмання», ми відчуємо, що «в середньому» ми будемо чекати половину максимально можливого часу очікування . І максимально можливий час очікування тут дорівнює максимально можливій тривалості між двома послідовними прибуттями. Позначимо наш час очікування і максимальну довжину між двома послідовними прибуттями автобуса , і ми це стверджуємо1515WR

(1)E(W)=12R=152=7.5

і ми праві.

Але раптом у нас відбирається впевненість, і нам кажуть, що зараз хвилин середня тривалість між двома приїздами автобуса. І ми потрапляємо в «пастку інтуїтивного мислення» і думаємо: «нам потрібно лише замінити на очікуване значення», і ми стверджуємо15R

(2)E(W)=12E(R)=152=7.5WRONG

Перший показник того, що ми помиляємось, - це те, що не є "довжиною між двома послідовними приїздами автобусів", це " максимальною довжиною тощо". Отже, у будь-якому випадку ми маємо, що .RE(R)15

Як ми дійшли рівняння ? Ми подумали: "час очікування може бути від до максимум . Я прибуваю з однаковою ймовірністю в будь-якому випадку, тому я" вибираю "випадковим чином і з однаковою ймовірністю всі можливі терміни очікування. Отже, половина максимальної тривалості між двома послідовними прибуттями автобуса - це моя середній час очікування ". І ми праві.(1)015

Але помилково вставивши значення в рівняння , воно більше не відображає нашу поведінку. Із замість рівняння говорить: "Я вибираю випадковим чином і з однаковою ймовірністю всі можливі періоди очікування , менші або рівні середній довжині між двома послідовними приїздами в автобус " - і ось тут наша інтуїтивна помилка полягає, тому, що наша поведінка не змінюється - так, прибувши випадково рівномірно, ми насправді до сих пір «вибираємо випадковим чином і з однаковою ймовірністю» всі можливі часів очікування - але «все можливе час очікування» є НЕ захоплений15(2)15E(R)(2)15 - ми забули правильний хвіст розподілу довжин між двома поспіль прибулими автобусами.

Тож, можливо, ми повинні обчислити очікуване значення максимальної довжини між будь-якими двома послідовними прибуттями автобусів, це правильне рішення?

Так, це могло б бути, але : конкретний "парадокс" йде рука об руку зі специфічним стохастичним припущенням: що приїзд автобусів моделюється за еталонним процесом Пуассона, що означає, що як наслідок ми припускаємо, що тривалість між будь-які два поспіль прибуття автобуса слідують за Експоненціальним розподілом. Позначимо цю довжину, і ми її маємо

f()=λeλ,λ=1/15,E()=15

Це, безумовно, приблизно, оскільки Експоненціальний розподіл має необмежену підтримку з правого боку, це означає, що строго кажучи, "всі можливі терміни очікування" включають, згідно з цим припущенням моделювання, великі і великі величини до і "включаючи" нескінченність, але з імовірністю зникання .

Але зачекайте, Експоненціал не запам’ятовується : незалежно від того, в який момент часу ми приїдемо, ми стикаємося з тією ж випадковою змінною , незалежно від того, що було раніше.

Враховуючи це стохастичне / розподільне припущення, будь-який момент часу є частиною "інтервалу між двома послідовними автобусами-приїздами", довжина яких описується тим самим розподілом ймовірностей із очікуваним значенням (не максимальним значенням) : "Я тут, я оточений інтервалом між двома автобусами-приїздами. Деяка його довжина лежить в минулому, а частина в майбутньому, але я не можу знати, скільки і скільки, тому найкраще, що я можу зробити, це запитати, яка його очікувана довжина - який буде мій середній час очікування? " - І відповідь завжди " ", на жаль. 151515


+1 Дуже приємно. можливо, повинен читати ? f λ ( )f()fλ()
амеба

Дякую. Щодо позначення, то обидва використовуються для позначення різних речей. Те, що я написав, - це щільність якого є випадковою змінною, тому що в різних перетвореннях ми можемо виявитись на кшталт . Що ви пропонуєте, це підкреслити параметризований аспект щільності. fX(y)
Алекос Пападопулос

80

Якщо автобус приїжджає "кожні 15 хвилин" (тобто за графіком), то середнє очікування пасажира (випадковим чином прибуваючим) дійсно становить лише 7,5 хвилин, оскільки він буде рівномірно розподілений у тому 15-хвилинному проміжку.

-

Якщо, з іншого боку, автобус прибуває випадковим чином із середньою швидкістю 4 на годину (тобто за процесом Пуассона), то середнє очікування значно довше; Дійсно, ви можете вирішити це через відсутність властивості пам'яті. Візьміть приїзд пасажира як початок, а час до наступної події експоненціальний із середніми 15 хвилин.

Дозвольте взяти дискретну аналогію часу. Уявіть, що я катаю штамп з 15 гранями, на одному з яких позначено "B" (для автобуса), а 14 - "X" за повну відсутність шини в цю хвилину (справедливі 30 двосторонні кістки існують, тому я міг би позначити 2 з грані 30-гранного штампу "В"). Тож раз на хвилину я кочуюсь і дивлюсь, чи приїжджає автобус. Плашка не має пам’яті; не знає, скільки булочок за останній "B". Тепер уявіть, що відбувається якась непоєднана подія - собака гавкає, приїжджає пасажир, я чую гуркіт грому. Відтепер, як довго я чекаю (скільки булочок) до наступного "В"?

Через брак пам’яті в середньому я чекаю того ж часу наступного «В», як і час між двома поспіль «В».

[Далі уявіть, що у мене 60-стороння штамповка, яку я кочую кожні п’ятнадцять секунд (знову з одним «В» обличчям); тепер уявіть, що я мав 1000-сторонні штампи, котив кожні 0,9 секунди (з одним обличчям "B"; або більш реально, три 10-сторонні кубики кожен, і я називаю результат "B", якщо всі 3 з'являються "10" на той же час) ... і так далі. В межах, ми отримуємо безперервний процес Пуассона.]

Ще один спосіб поглянути на це: я, швидше за все, спостерігаю за моїм "початковим рахунком валків" (тобто "пасажир прибуває на автобусній зупинці") під час більш тривалого розриву, ніж короткий, саме правильним способом зробити середній час очікування такий самий, як і середній час між автобусами (я в основному чекаю з великими проміжками і в основному пропускаю найкоротші, тому що я приходжу в рівномірно розподілений час, шанс я приїхати в проміжок довжиною пропорційний )тtt

Як ветеран-ловець автобусів, насправді, схоже, реальність лежить десь між "автобуси прибувають за розкладом" і "автобуси прибувають навмання". І іноді (при поганому русі) ви чекаєте години, а потім 3 прибувають усі відразу (Зак визначає причину цього в коментарях нижче).


6
Я думаю, що в автобусах конкретно є додатковий процес, коли пізній автобус стає пізніше, коли пасажири натикаються на нього, а порожній автобус позаду нього зрештою наздоганяє (але залишається порожнім). = D
Зах

4
@Zach дійсно, тому вони, як правило, збиваються на тривалих маршрутах, особливо в інтенсивному трафіку. Там, де я живу, коли автобус курсує так пізно, що настає час для наступного, вони іноді вставлятимуть додатковий автобус, який майже за часом далі по маршруту (тобто він буде їздити без пасажирів туди, де автобус буде не дуже відсталий розклад, часто доїжджаючи туди швидшим маршрутом) і почати підбирати пасажирів, для яких зараз автобус лише трохи запізнюється. Тим часом, дуже пізній автобус стає фактично наступним автобусом за розкладом, як тільки він дістається туди, куди приїхав інший автобус.
Glen_b

@Glen_b Це дійсно гарна ідея, так!
Зак

Це корисна стратегія проти скупчення (принаймні, вона пом’якшує найгірші випадки); Я б не підніс це, за винятком того, що це стосується таких питань залежності, з якими можуть знадобитися більш точні моделі очікування на автобус.
Glen_b

10

Більше про автобуси ... Вибачте, що впіймайте в розмову так пізно в дискусії, але останнім часом я дивився на процеси Пуассона ... Отже, перш ніж це вислизнути з розуму, ось мальовниче зображення парадоксу інспекції :

Помилковість випливає з припущення, що оскільки автобуси дотримуються певної схеми прибуття із заданим середнім часом прильоту (зворотним параметром швидкості Пуассона , назвемо це хв. ), з’являючись на автовокзалі в будь-який випадковий час, ви фактично підбираєте автобус. Тож якщо ви з'являєтесь на автовокзалі випадковим чином, ведення журналу журналу очікування, скажімо, одного місяця, фактично дасть вам середній час між приїздами між автобусами. Але це не те, що ти робиш.θ = 1 / λ = 15λθ=1/λ=15

Якби ми були в диспетчерському центрі і могли бачити всі автобуси на екрані, то було б правдою, що випадковий вибір декількох автобусів і усереднення відстані до автобуса, що слідує позаду, створили б середній час між приїздами:

введіть тут опис зображення

Але, якщо те, що ми замість цього робимо, просто з’являється на автовокзалі (замість того, щоб вибрати автобус), ми робимо випадковий переріз часу, скажімо, за часовою шкалою розкладу руху автобусів у типовий ранок. Час, який ми вирішимо показати на автовокзалі, цілком може бути рівномірно розподілений по "стрілці" часу. Однак, оскільки між автобусами більше відстають у часі, ми, швидше за все, перестанемовлятись на цих «страхітників»:

введіть тут опис зображення

... і, отже, наш журнал часу очікування не відображатиме час між приїздом. Це парадокс інспекції.

Що стосується власне питання щодо ОП щодо очікуваного часу очікування , хвилини химерного пояснення перебувають у безпам’ятності процесу Пуассона, завдяки чому проміжок часу минув з часу, коли останній автобус ми пропустили станція до того часу, коли ми виявимось неактуальною, і очікуваний час до приїзду наступного автобуса продовжує залишатися вперто хвилин. Це найкраще видно в дискретний час (геометричний розподіл) на прикладі кісток у відповіді Glen_b. θ = 1515θ=15

Насправді, якби ми могли знати, як давно поїхала попередня шина, хв! Як пояснюється у цьому відео MIT Джона Ціцикліса , нам просто слід було б побачити, що передує точці прибуття як процесу Пуассона назад у часі:E[time waiting (future) + time to last bus departure (past)]=30


введіть тут опис зображення


Досі незрозуміло? - спробуйте з Легосом .


Відмінні схеми.
Glen_b

2

Існує просте пояснення, яке вирішує різні відповіді, які отримує, розраховуючи очікуваний час очікування для автобусів, що прибувають за процесом Пуассона, із заданим середнім часом взаємодії (в даному випадку 15 хвилин), час взаємозв'язку якого, таким чином, є експоненціальним із середнім значенням 15 хвилин .

Метод 1 ) Оскільки процес Пуассона (експоненційний) є без запам'ятовування, очікуваний час очікування - 15 хвилин.

Спосіб 2 ) Ви з однаковою ймовірністю приїдете в будь-який час протягом періоду взаємодії, в який ви приїжджаєте. Тому очікуваний час очікування становить 1/2 очікуваної тривалості цього періоду взаємодії. ЦЕ ПРАВИЛЬНО і не суперечить методу (1).

Як можуть бути правильними (1) і (2)? Відповідь полягає в тому, що очікувана тривалість міжмоторного періоду за час, на який ви приїжджаєте, не становить 15 хвилин. Це насправді 30 хвилин; і 1/2 від 30 хвилин - це 15 хвилин, тому (1) і (2) погоджуємося.

Чому період взаємозв'язку за час, коли ви приїжджаєте, не дорівнює 15 хвилин? Це тому, що спочатку "фіксуючи" час прибуття, період міжприбуткових дій, в якому він перебуває, швидше, ніж в середньому, буде тривалим періодом взаємодії. У випадку експоненціального періоду міжприбуткового курсу математика працює на виході, тому період міжприбуткових дій, що містить час, коли ви приїжджаєте, є експоненціальним із подвоєним середнім часом міжприбуткових процесів Пуассона.

Не очевидно, що точний розподіл на час міжприбутку, що містить час, коли ви прибуваєте, був би експоненцією з подвоєним середнім значенням, але після пояснення очевидно, чому він збільшується. Як легкий для розуміння приклад, скажімо, що час взаємодії - 10 хвилин з вірогідністю 1/2 або 20 хвилин з ймовірністю 1/2. У цьому випадку тривалість взаємозв'язку тривалістю 20 хвилин настільки ж вірогідна, як і 10-хвилинні міжособистісні періоди, але коли вони трапляються, вони тривають удвічі довше. Отже, 2/3 моменти часу протягом дня становитимуть моменти, коли період взаємодії становить 20 хвилин. Інакше кажучи, якщо ми спочатку підберемо час, а потім хочемо знати, що таке час взаємодії, що містить цей час, то (ігноруючи перехідні ефекти на початку "дня" ) очікувана тривалість цього часу взаємодії становить 16 1/3. Але якщо ми спочатку підберемо час взаємодії і хочемо знати, яка його очікувана тривалість, це 15 хвилин.

Існують і інші варіанти парадокса відновлення, вибірки з упередженою довжиною тощо, що становить майже те саме.

Приклад 1) У вас є купа лампочок з випадковим життям, але в середньому 1000 годин. Коли лампочка виходить з ладу, її негайно замінюють іншою лампочкою. Якщо ви вибрали час для переходу в приміщення, в якому є лампочка, то ввімкнена лампочка згортається з довшим середнім терміном служби, ніж 1000 годин.

Приклад 2) Якщо ми переходимо на будівельний майданчик у визначений час, тоді середній час, поки будівельник, який працює в цей час, не впаде з будівлі (з моменту, коли вони вперше почали працювати), перевищує середній час, поки робочий випадає (з моменту, коли вони вперше почали працювати) з-поміж усіх робітників, які починають працювати. Чому, тому що робітники, які мають короткий середній час до падіння, швидше за середній, вже відпали (а не продовжували працювати), так що робітники, які працюють тоді, мають довший середній час до падіння.

Приклад 3) Виберіть у місті випадкову кількість людей, і якщо вони відвідували домашні ігри (не всі розпродажі) міської команди з вищої ліги з бейсболу, з’ясуйте, скільки людей відвідували ігри, в яких вони були. Тоді (за деякими дещо ідеалізованими, але не надто необгрунтованими припущеннями) середня відвідуваність цих ігор буде вище середньої відвідуваності всіх домашніх ігор команди. Чому? Оскільки є більше людей, які відвідували ігри з більшою відвідуваністю, ніж ігри з низькою відвідуваністю, тож ви, швидше за все, обираєте людей, які відвідували ігри з високою відвідуваністю, ніж ігри з низькою відвідуваністю.


0

Поставлене питання було "... автобус прибуває на зупинці кожні 15 хвилин, а пасажир прибуває навмання". Якщо автобус прибуває кожні 15 хвилин, то це не випадково; він приходить кожні 15 хвилин, тому правильна відповідь - 7,5 хвилин. Або джерело було неправильно цитоване, або письменник джерела був неохайним.

З іншого боку, детектор випромінювання звучить як інша проблема, оскільки радіаційні події приходять випадковим чином за деяким розподілом, імовірно, чимось на зразок Пуассона із середнім часом очікування.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.