Чи змінюється розподіл ймовірностей урни, коли ви берете з неї без заміни в середньому?


9

Припустимо, у мене є урна, що містить N різних кольорів кульок, і кожен різний колір може з’являтися різну кількість разів (якщо є 10 червоних кульок, також не повинно бути 10 синіх кульок). Якщо ми знаємо точний вміст урни перед малюванням, ми можемо сформувати дискретний розподіл ймовірностей, який повідомляє нам про ймовірність малювання кожного кольору кулі. Мене цікавить, як змінюється розподіл після нанесення k кульок без заміни з урни в середньому. Я розумію, що, коли ми беремо з урни, ми можемо оновити розподіл на основі знань про те, що було вийнято, але те, що я хочу знати, це те, що ми очікували б форми розподілу після того, як ми видалимо k куль. Чи змінюється розподіл в середньому чи він залишається колишнім? Якщо він не залишиться таким же, чи можемо ми записати якусь формулу для того, як ми очікуємо, що новий розподіл буде виглядати в середньому після того, як буде зроблено k нічиї?


1
я можу помилятися - але це здається, що хтось знає попередній розподіл, але не має інформації про ймовірність (крім того, що k кульки видаляються). у такому випадку - я б припустив, що задній дорівнює попередньому. Якщо бути справедливим - є вірогідна інформація, що кількість кульок зменшилася, і що (для одного вилученого кульки) розподіл є, отже, наприклад бімодальний між 50% можливістю 9 червоних та 10 чорних та 50% можливістю 10 червоних та 9 чорних . я маю помилку тут, хоча
Wouter

Моя інтуїція полягає в тому, що це як останній випадок, який ви описали. Я не можу знайти нікого, хто б говорив про подібний процес.
mjnichol

Відповіді:


7
  1. "Прямий розрахунок": Нехай в урні буде кульок кольорів. Зосередимось на ймовірності малювання одного конкретного кольору, скажімо, білого , на другому малюнку . Нехай кількість білих кульок буде . Нехай - колір кулі, отриманий на -му розіграші.nmnwXii

    П(Х2=W)=П(Х2=W|Х1=W)П(Х1=W)+П(Х2=W|Х1=W¯)П(Х1=W¯)=нш-1н-1ншн+ншн-1н-ншн=нш(н-нш+нш-1)н(н-1)=ншн=П(Х1=W)

    Звичайно, цей самий аргумент стосується будь-якого кольору на другому розіграші. Ми можемо застосовувати один і той же тип аргументів рекурсивно при розгляді наступних малюнків.

    [Можна, звичайно, виконати ще більш прямий розрахунок. Розгляньте перші як такі, що складаються з білих кульок та кульок (з вірогідністю, заданими гіпергеометричним розподілом), і виконайте відповідний обчислення до простого вище, але для малювання на кроці ; хтось отримує подібне спрощення та скасування, але це не особливо просвічує.]кiк-iк+1

  2. Коротший аргумент: розгляньте мітки кульок випадковим чином цифрами , а потім намалюйте їх у позначеному порядку. Питання тепер стає "Чи ймовірність того, що дана мітка, , розміщена на білій кулі, така ж, як ймовірність розміщення мітки на білій кулі?"1,2,...,нк1

    Тепер ми бачимо, що відповідь повинна бути "так" за симетричністю етикетки. Аналогічно, за симетрією кульових кольорів не має значення, що ми сказали "білі", тому аргумент, що мітка та мітка мають однакову ймовірність, стосується будь-якого кольору. Отже, розподіл на -му розіграші такий же, як і для першого жеребкування, доки ми не маємо додаткової інформації з попередніх жеребкувань (тобто до тих пір, поки попередні намальовані кулі не видно).к1к


Тісно пов'язаний з вашим другим способом - ще один короткий аргумент: уявіть собі набір усіх можливих послідовностей, з яких кульки можна видалити (наприклад, спочатку синій, потім білий, потім білий, ... може бути одна така послідовність). Якщо для кожної послідовності в цьому наборі ми поміняємо елементи і , ми просто перестановимо набір. Отже, для кожної послідовності з білою (або будь-якою) кулькою в положенні існує точно одна відповідна послідовність з білою кулькою в положенні . Отже, ймовірність білого кулі в положенні або положенні повинна бути однаковою. Я думаю, що це по суті аргумент Ніла. 1стктгодк1к1
Срібна рибка

@Silverfish Так, дивлячись на це, мій другий аргумент - це по суті такий же аргумент, як аргумент перестановки Ніла.
Glen_b -Встановіть Моніку

Дякую за пояснення. Це було саме те, що мені потрібно було побачити!
mjnichol

6

Єдина причина, по якій не зовсім очевидно, що розподіл залишається незмінним (за умови, що залишається хоча б одна куля), - це занадто багато інформації. Давайте викреслимо відволікаючий матеріал.

На хвилину проігноруйте колір кожної кульки. Зосередьтеся на одній кулі. Припустимо, кульки будуть збиратися випадковим чином (а не спостерігатись), і тоді буде витягнутий та спостережений й куля. Не має значення, в якому порядку відбувається вибір, тому ви можете також спостерігати за першим намальованим кулькою (а потім, якщо ви наполягаєте, видаліть ще куль). Розподіл очевидно не змінився, тому що на нього не буде впливати видалення інших куль.кк+1кк


Цей аргумент - хоча цілком справедливий - може змусити деяких людей почувати себе непросто. Наступний аналіз може бути сприйнятий як більш суворий, оскільки він не вимагає від нас ігнорувати порядок відбору.

Продовжуйте фокусуватись на своєму м'ячі. Це матиме певну ймовірність вибору як го кулі. Незважаючи на те, що легко обчислити, нам не потрібно знати його значення: важливо лише те, що воно повинно бути однаковим для кожного кулі (оскільки всі кулі є рівнозначними) і що це ненульове значення. Але якби він дорівнював нулю, жоден бал не мав би жодної ймовірності його вибору: так що поки щонайменше один куля залишиться .pкк+1pкpк0

Знову зверніть увагу на кольори. За визначенням, ймовірність того, що буде обраний конкретний колір (після того, як кулі будуть випадковим чином вилучені), це сума шансів усіх оригіналівСкС-кольорові кульки, поділені на суму шансів усіх оригінальних кульок. Коли вони спочатку єкС кульки кольору С і н кулі загалом, це значення

Прк(С)=кcpкнpк=кcн.

Коли не залежить від , QED .к<нк


Дякую за коментар Це допомогло мені більше зрозуміти основні процеси!
mjnichol

2

Нехай розподіл малювання однієї кулі - після того, як вже намалювали кульки без заміни - має категоричний розподіл враховуючи розподіл за такими категоричними розподілами .кЕ(Dк)Dк

Я думаю, ви запитуєте, чи є постійним.Е(Dк)

Я думаю це. Припустимо, ви врешті-решт намалюєте всі кулі. Усі перестановки кульок однаково вірогідні. Імовірність малювання спочатку становить . Ви можете змінити свій вибір на однаково вірогідну перестановку, коли ваш перший обраний бал був обраний останнім, а ваш другий вибраний перший. Цей куля має очікування , яке повинно бути рівним через симетрію. За індукцією всі рівні.Е(D0)Е(D1)Е(D0)Е(Di)


Ви маєте на увазі, що я запитую, чи є постійним для кожного k, правда? Е(Dк)
mjnichol

@mjnichol right
Neil G

0

"Очікуваний розподіл" не змінюється. Можна використати аргумент мартінгала! Я додам таку відповідь пізніше (зараз я подорожую).

Розподіл, що залежить від попередніх розіграшів (для пізніших розіграшів), змінюється лише тоді, коли ви насправді спостерігаєте за нічиями. Якщо ви намалюєте кулю з урни щільно закритою рукою, а потім викидаєте її, не дотримуючись її кольору (я ефективно використовував такий театр, як демонстрація класу), розподіл не змінюється. Цей факт має своє вираження: ймовірність стосується інформації, ймовірність - це інформаційне поняття.

Тому ймовірності змінюються лише тоді, коли ви отримуєте нову інформацію (тобто умовні ймовірності). Витягнення кулі та викидання його без спостереження не дає вам ніякої нової інформації, тому нічого нового не можна спричинити. Тож, коли ви вказуєте на фактичний набір інформації, він не змінився, тому умовний розподіл не може змінитися.

 EDIT

Зараз я не буду давати набагато більше деталей до цієї відповіді, лише додам одне посилання: Хосам М. Махмуд: "Моделі Urna Pólya" (Chapman & Hall), яка розглядає моделі урн, як та, що в цьому питанні, а також набагато більш узагальнену урну схеми, також використовуючи методи мартінгале для отримання граничних результатів. Але методи мартінгале не потрібні для запитання в цій публікації.


Розподіл (для пізніших розіграшів) не змінюється навіть тоді, коли ви насправді спостерігаєте за нічиями. Чому слід спостерігати за тим, щоб щось змінило?
Ніл Г

1
@Neil Я думаю, що kjetil має на увазі розподіл, що залежить від спостережуваних нічиїх .
Срібна рибка

@Silverfish: Ах, бачу. Ти маєш рацію, мої вибачення.
Ніл Г

Я відредагую, щоб було зрозуміліше, коли вдома за два тижні. На даний момент відпустка у Венеції ...
kjetil b halvorsen
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.