Очікувана кількість чітких кольорів при малюванні без заміни


15

Розглянемо урну, що містить N кульок P різних кольорів, при цьому pi - частка кульок кольору i серед N кульок ( ipi=1 ). Я малюю кульок з урни без заміни і дивлюся на кількість різних кольорів серед кульок, які були намальовані. Яке очікування як функції залежно від відповідних властивостей розподілу ?nNγγn/Np

Щоб дати більше розуміння: якщо і для всіх , я завжди буду бачити саме кольорів, тобто . В іншому випадку, можна показати , що очікування - IS . Для фіксованих і здається, що коефіцієнт, на який помножити був би максимальним, коли рівномірний; можливо, очікувана кількість різних кольорів, які можна побачити, обмежена як функція і, наприклад, ентропія ?N=Ppi=1/Pinγ=P(n/N)γ>P(n/N)PNn/Npn/Np

Це, мабуть, пов'язане з проблемою збирача купонів, за винятком того, що відбір проб проводиться без заміни, а розподіл талонів не є рівномірним.


1
Я думаю, що цю проблему можна констатувати так: яка очікувана кількість ненульових записів у вибірці з багатовимірного гіпергеометричного розподілу ?
Кодіолог

Відповіді:


2

Припустимо , у вас є квітів , де до N . Нехай б я позначаю число куль кольору я так Е б я = N . Нехай В = { Ь 1 , ... , Ь до } , і нехай Е я ( B ) фіксувати безлічі, що складаються з я елементних підмножин B . Нехай Q n , c позначає кількість способів вибору nkkNbiibi=NB={b1,,bk}Ei(B)iBQn,cnелементів із наведеного набору таким чином, що кількість різних кольорів у вибраному наборі дорівнює . Для c = 1 формула проста:cc=1

Qn,1=EE1(B)(eEen)

Для ми можемо порахувати набори кульок розміром n, який має максимум 2 кольори мінус кількість наборів, які мають рівно 1 колір:c=2n1

Qn,2=EE2(B)(eEen)(k11)Qn,1

- це кількість способів додати колір до фіксованого кольору таким чином, що у вас буде 2 кольори, якщо у вас єkкольорів. Загальна формула полягає в тому, якщо у вас єc1фіксованих кольорів і ви хочете зробитиз неї2кольори, тоді як у вас єkкольорів загалом (c1c2k) є ( k-c1(k11)kc1c2kc1c2k. Тепер у нас є все, щоб отримати загальну формулу дляQn,c:(kc1c2c1)Qn,c

Qn,c=EEc(B)(eEen)i=1c1(kici)Qn,i

Ймовірність того, що у вас будуть точно кольори, якщо ви намалюєте n кульок, це:cn

Pn,c=Qn,c/(Nn)

Також зауважте, що якщоy>x.(xy)=0y>x

Напевно, є спеціальні випадки, коли формулу можна спростити. Цього разу я не намагався знайти ці спрощення.

Очікуване значення, яке ви шукаєте для кількості кольорів, залежних від , таке:n

γn=i=1kPn,ii

4
Ви називаєте ймовірністю, але ви, схоже, визначили це як суму цілих чисел. Ти забув розділити чимось? Pn,c
Кодіолог

Так, я думаю, ти маєш рацію. Вам потрібно розділити на , але, на жаль, це все одно не так. ЯкщоE,FEc(B)іEFя роблю подвійний облік у наведеній вище формулі. (Nn)E,FEc(B)EF
jakab922

Seems like the formula can be fixed by using the sieve method. I will post a fix later today.
jakab922
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.