Яка щільна нижня межа часу збирання купона?


20

У класичній проблемі колекціонера купонів добре відомо, що час необхідний для заповнення набору випадково вибраних купонів, задовольняє , і .TnE[T]nlnnVar(T)n2Pr(T>nlnn+cn)<ec

Ця верхня межа краща за ту, що задана нерівністю Чебишева, яка була б приблизно 1/c2 .

Моє запитання: чи є відповідна нижча межа Т, що краща за Чебишева для ТT ? (наприклад, щось на кшталт Pr(T<nlnncn)<ec )?


Очевидною нижньою межею є Pr(T<n)=0 , але я думаю, ви це знаєте ...
onestop

Відповіді:


14

Я надаю це як другу відповідь, оскільки аналіз є абсолютно елементарним і дає саме бажаний результат.

Пропозиція Для c>0 і n1 ,

P(T<nlogncn)<ec.

Ідея доказу проста:

  1. Представіть час, поки всі купони не будуть зібрані як T=i=1nTi , де Ti - час, коли зібраний i й (раніше) унікальний купон. Ti геометричні випадкові величини із середнім часи nni+1 .
  2. Застосуйте версію зв'язаного Chernoff та спростіть.

Доказ

Для будь-якого і будь-якого маємо, що s > 0 P ( Tt s>0

P(T<t)=P(esT>est)estEesT.

Оскільки і незалежні, ми можемо записати T iT=iTiTi

EesT=i=1nEesTi

Оскільки є геометричним, скажімо, з ймовірністю успіху , то простий обчислення показує p i E e - s T i = p iTipi

EesTi=pies1+pi.

для нашої задачі є , , і т.д. Отже, p 1 = 1 p 2 = 1 - 1 / n p 3 = 1 - 2 / n n i = 1pip1=1p2=11/np3=12/n

i=1nEesTi=i=1ni/nes1+i/n.

Давайте вибирати і для деяких . Тоді і , даючи t = n log n - c n c > 0 e s t = n e - c e s = e 1 / n1 + 1 / n n i = 1 i / ns=1/nt=nlogncnc>0

est=nec
es=e1/n1+1/n
i=1ni/nes1+i/ni=1nii+1=1n+1.

Складаючи це разом, отримуємо, що

P(T<nlogncn)nn+1ec<ec

за бажанням.


Це дуже приємно і саме те, що призначив лікар. Дякую.
Девід

@David, просто цікаво: що призначений додаток?
кардинал

Довга історія. Я намагаюся довести нижню межу часу змішування ланцюга Маркова, який я приготував, щоб проаналізувати час роботи алгоритму, який мене цікавить - що, як виявляється, зводиться до нижньої межі .колекторна проблема. До речі, я грав з намагаюся знайти саме такого роду Чернов стилю пов'язаний, але не зрозумів, як позбутися від цього продукту в . Добрий вибір дзвінка :-). s = 1 / nis=1/n
Девід

@David, , хоча майже напевно субоптимальний, здавалося очевидним, що слід спробувати, оскільки це дало , що є тим самим терміном, що і отримане у виведенні для верхня межа. e s t = n e - cs=1/nest=nec
кардинал

1
Запит : Доказ, який я дав вище, - мій власний. Я працював над цим із задоволенням, оскільки проблема мене заінтригувала. Однак я не претендую на новизну. Справді, я не можу уявити, що подібного доказу з використанням подібної методики в літературі вже не існує. Якщо хтось знає про посилання, будь ласка, опублікуйте це як коментар тут. Мені було б дуже цікаво дізнатися про таке.
кардинал

9

Хоча @cardinal вже дав відповідь, яка дає саме ту межу, яку я шукав, я знайшов подібний аргумент у стилі Черноффа, який може дати більш сильну межу:

Пропозиція : (це сильніше для )c > π 2

Pr(Tnlogncn)exp(3c2π2).
c>π23

Доказ :

Як і у відповіді @ кардинала, ми можемо використовувати той факт, що - сума незалежних геометричних випадкових величин з ймовірністю успіху . Звідси випливає, що і .T i p i = 1 - i / n E [ T i ] = 1 / p i E [ T ] = n i = 1 E [ T i ] = n n i = 1 1TTipi=1i/nE[Ti]=1/piE[T]=i=1nE[Ti]=ni=1n1inlogn

Визначте нові змінні , і . Тоді ми можемо записати S : = i S i Pr ( T n log n - c n ) Pr ( T E [ T ] - c n ) = Pr ( S - c n ) = Pr ( exp ( - s S)Si:=TiE[Ti]S:=iSi

Pr(Tnlogncn)Pr(TE[T]cn)=Pr(Scn)
=Pr(exp(sS)exp(scn))escnE[esS]

Обчислюючи середні показники, ми маємо

es-1sez

E[esS]=iE[esSi]=ies/pi1+1pi(es1)e12s2ipi2
де нерівність випливає з фактів, що а також для .es1sz0ez1+ze12z2z0

Таким чином, оскільки , ми можемо записати Pr(Tпувійтип-зп) е 1ipi2=n2i=1n11i2n2π2/6

Pr(Tnlogncn)e112(nπs)2scn.

Мінімізуючи , ми нарешті отримуємо Pr ( T n log n - c n ) e - 3 c 2s>0

Pr(Tnlogncn)e3c2π2

1
(+1) Модуло пару незначних помилок, це приємно. Розширення навколо чогось близького до середнього, як ви робили, часто працює краще. Я не здивований, коли бачу збіжність вищого порядку з урахуванням асимптотичних результатів. Тепер, якщо ви показуєте подібну верхню межу, то доказ є субекспоненціальним у термінології Вершиніна, що має багато наслідків щодо концентрації вимірювання. (Tnlogn)/n
кардинал

1
Аргумент, схоже, не узагальнюється безпосередньо до верхньої межі. Обміняючи на (і на ), можна виконати ті самі кроки до моменту обчислення . На даний момент, найкраще, що я можу зробити, - це використовувати , який ще залишає і я не Я не знаю, що з цим робити- c s - s E [ e s S ] i e - s / p iccs-сЕ[есS]iе-с/pi1-сpiе-z1-zдосвід(z22(1-z))
Е[есS]е12с2ipi2(1-с/pi)
Девід

2
Цікаво, що весь аргумент (для нижньої межі), здається, працює не лише для проблеми з колектором купонів, але і для будь-якої суми неідентифікованих незалежних геометричних змінних із обмеженою дисперсією. Зокрема: задано , де кожен є незалежним GV з імовірністю успіху , і де , тоді Т=iТiТipiipi-2А<
Пр(ТЕ[Т]-а)е-а22А
Девід

4

Важлива примітка : Я вирішив видалити доказ, який я дав спочатку в цій відповіді. Це було довше, більш обчислювально, використовували великі молотки і виявляли слабший результат порівняно з іншими доказами, які я дав. Все навколо, неповноцінний підхід (на мій погляд). Якщо ви дійсно зацікавлені, я думаю, ви можете переглянути зміни.

Асимптотичні результати, які я спочатку цитував і які все ще знайдені нижче у цій відповіді, показують, що як ми можемо зробити трохи краще, ніж пов'язане, що доводиться в іншій відповіді, яка справедлива для всіх .н н


Наступні асимптотичні результати справедливі

П(Т>нжурналн+cн)1-е-е-c

і

П(Тнжурналн-cн)е-еc.

Константа та межі приймаються як . Зауважте, що, хоча вони розділені на два результати, вони майже однаковий результат, оскільки ні в якому разі не обмежується тим, що не має негативного характеру.cRнc

Див., Наприклад, Мотвані та Рагаван, Рандомізовані алгоритми , стор. 60--63 для доказу.


Також : Девід люб'язно надає доказ своєї заявленої верхньої межі в коментарях до цієї відповіді.


Так, це справедливо для кожного фіксованого . Докладний (дуже простий) доказ можна знайти, наприклад, у книзі Левіна, Переса та Вілмера «Маркові ланцюги та часи перемішування», пропозиція 2.4. Доказ не працює для нижньої межі. н
Девід

1
Насправді, я міг би також переписати доказ тут: "Нехай буде випадком, коли тип -го [купона] не з'явиться серед перших купонів, намальованих. Спочатку зауважте, що . Оскільки кожна пробна версія має ймовірність не вивести купон і випробування незалежні, права частина вгорі обмежена вище , доводячи (2.7). " Аiiнжурналн+cнП(τ>нжурналн+cн)=П(iАi)iП(Аi)1-н-1ii(1-1/н)нжурналн+cнндосвід(нжурналн+cнн)=е-c
Девід

@David, це приємно і просто. Я швидко зіграв із розширенням формули включення-виключення іншим терміном, але нікуди не потрапив швидко і не встиг переглянути це далі. Подія еквівалентна події, коли після випробувань не залишилося жодних купонів . З цим має бути пов’язаний мартингал. Ви спробували нерівність Геффдінга на (імовірно) асоційованому мартингале? Асимптотичний результат передбачає сильну концентрацію. {Т<тн}тн
кардинал

@David, у вашому доказі вище вказаний знак, але я впевнений, що це очевидно і для інших читачів.
кардинал

@David, дивіться мою іншу опубліковану відповідь на ваше запитання. Метод відрізняється від верхньої межі, яку ви даєте, але використовувані інструменти майже настільки ж елементарні, на відміну від відповіді, яку я дав тут.
кардинал

2

Бенджамін Доер дає (у розділі "Аналіз евристики рандомізованого пошуку: інструменти з теорії ймовірностей" у книзі "Теорія евристики рандомізованого пошуку", див. Посилання на Інтернет-PDF) дещо просте доказ

Пропозиція Нехай - час зупинки процесу збору купонів. Тоді .ТПр[Т(1-ϵ)(н-1)lnн]е-нϵ

Це, здається, дає бажані асимптотики (з другої відповіді @ кардинала), але з перевагою, що це правда для всіх та .нϵ

Ось доказний ескіз.

Ескіз доказування: Нехай є випадком, коли -й купон буде зібраний у першій розіграші . Таким чином, . Ключовим фактом є те, що мають негативну кореляцію для будь-якого , . Інтуїтивно це досить чітко, оскільки знаючи, що -й купон у першому розіграші зробить меншою ймовірність того, що -й купон також буде намальований у першому розіграші. ХiiтПр[Хi=1]=(1-1/н)тХiЯ[н]Пр[iЯ,Хi=1]iЯПр[Хi=1]iтjт

Можна довести претензію, але збільшивши набір на 1 на кожному кроці. Тоді вона зводиться до показуючи , що , для . Рівнозначно, шляхом усереднення, воно зводиться до показу, що . Для цього Doerr дає лише інтуїтивний аргумент. Один проспект до доказу такий. Можна помітити, що обумовлено купоном, що надходить після всіх купонів у , що ймовірність витягти новий купон з після малювання поки що , замість попередньогоЯПр[iЯ,Хi=1|Хj=1]Пр[iЯ,Хi=1]jЯj I I k | Я | - кПр[iЯ,Хi=1|Хj=0]Пр[iЯ,Хi=1]jЯЯк | Я| -к|Я|-кн-1 jI|Я|-кн . Таким чином, розкладаючи час для збору всіх купонів у вигляді суми геометричних випадкових змінних, ми можемо побачити, що обумовлення -купону, що настає після того, як збільшує ймовірність успіху, і, таким чином, виконуючи умову, лише збільшує ймовірність збирати купони раніше ( шляхом стохастичного домінування: кожна геометрична випадкова величина збільшується в умові стохастичного домінування за умови обумовлення, і це домінування потім може бути застосоване до суми).jЯ

Зважаючи на цю негативну кореляцію, випливає, що , що дає бажаний зв'язаний з . t = ( 1 - ϵ ) ( n - 1 ) ln nПр[Т(1-ϵ)(н-1)lnн](1-(1-1/н)т)нт=(1-ϵ)(н-1)lnн

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.