Аналіз кульок і Бенса в режимі m >> n.


17

Добре відомо, що якщо ви кидаєте n кульок у n контейнерів, велика ймовірність, що у найзавантаженому смітнику є кульки O(logn) . Взагалі можна запитати про m>n кульок у n бункерах. Доповідь RANDOM 1998 від Raab і Steger досліджує це детально, показуючи, що зі збільшенням m ймовірність навіть трохи перевищити очікуване значення m/n швидко зменшується. Приблизно, встановлюючи r=m/n , вони показують, що ймовірність бачити більше r+rlogn єo(1).

Цей документ з'явився в 1998 році, і я нещодавно не знайшов. Чи є нові і навіть більш концентровані результати за цією ознакою, або є евристичні / формальні причини підозрювати, що це найкраще, що можна отримати? Варто додати, що у відповідному документі щодо варіанту з множинним вибором у співавторстві Анжеліки Штегер у 2006 році також не цитується жодна пізня робота.

Оновлення : У відповідь на коментар Петра, дозвольте мені уточнити те, що я хотів би знати. У мене тут дві мети.

  1. По-перше, мені потрібно знати, які посилання цитувати, і, схоже, це остання робота над цим.
  2. По-друге, вірно, що результат досить щільний у діапазоні r = 1. Мене цікавить діапазон m >> n, а саме область, де r може бути poly log n або навіть n ^ c. Я намагаюся зафіксувати цей результат у лемі, яку я доказую, і специфічне обмеження на r контролює інші частини загального алгоритму. Я думаю (але не впевнений), що діапазон на r, наданий цією книжкою, може бути достатнім, але я просто хотів переконатися, що немає більш жорсткої межі (це дасть кращий результат).

3
Я дізнався назву "проблема зайнятості" з тегу, тому дякую, що розмістив навчальне питання. :)
Tsuyoshi Ito

7
Дивлячись на папери Рааба і Стегера, мені важко зрозуміти, яких подальших результатів ви хотіли б у цьому напрямку. Чи є конкретне запитання, на яке потрібно знати відповідь? Якщо це так, ви можете запитати його тут або на MathOverflow. Зокрема, якщо r=m/n , Raab і Steger дають тугу межу де2- правильна константа. r+2rlogn2
Пітер Шор

@Peter Я відредагую питання: це дійсний пункт.
Суреш Венкат

Відповіді:


8

Насправді не повна відповідь (ні корисна довідка), а лише досить розширений коментар. Для будь-якого заданого біна ймовірність наявності в Bin точно кульок буде задана p B = ( mB. Ми можемо використовувати нерівність через Sondow,((b+1)apB=(mB)(1n)B(n1n)mB, щоб отриматиpB<((r+1)r+1((b+1)aa)<((b+1)b+1bb)a, деr=mpB<((r+1)r+1rr)B(1n)B(n1n)mB. Зауважимо, що ця межа досить щільна, оскільки a ( (b+1)ar=mB1.((b+1)aa)>14ab((b+1)b+1bb)a

Таким чином, маємо . Тепер, оскільки вас цікавить ймовірність знайти B або більше кульок у відро, ми можемо розглянути p B = m b = B p b <pB<eB(r+1)ln(r+1)Brlnrmlnn+(mB)ln(n1)B . Переставляючи доданки, отримуємо p B < e - m ln npB=b=Bmpb<b=Bmeb(r+1)ln(r+1)brlnrmlnn+(mb)ln(n1)

pB<emlnnn1×eB(r+1)ln(r+1)BrlnrBln(n1)b=0mBeb(r+1)ln(r+1)brlnrbln(n1).

pB<emlnnn1×eB(r+1)ln(r+1)BrlnrBln(n1)×1((r+1)r+1rr(n1))mB+11((r+1)r+1rr(n1)).
If we rewrite (r+1)r+1rr(n1) terms using exponentials, we get
pB<emlnnn1×eB(r+1)ln(r+1)BrlnrBln(n1)×1(e(r+1)ln(r+1)rlnrln(n1))mB+11e(r+1)ln(r+1)rlnrln(n1),
which then becomes
pB<emlnnn1×(eB((r+1)ln(r+1)rlnrln(n1))e(m+1)((r+1)ln(r+1)rlnrln(n1)))1e(r+1)ln(r+1)rlnrln(n1).

Now, I take it you care about finding some B such that pB<Cn for some constant C, since this gives the total probability of any bin having B or more balls as bounded from above by C. This criteria is satisfied by taking

emlnnn1×(eB((r+1)ln(r+1)rlnrln(n1))e(m+1)((r+1)ln(r+1)rlnrln(n1)))1e(r+1)ln(r+1)rlnrln(n1)=Cn,
which can be rewritten as
B=ln(Cnemlnnn1(1e(r+1)ln(r+1)rlnrln(n1))+e(m+1)((r+1)ln(r+1)rlnrln(n1)))(r+1)ln(r+1)rlnrln(n1).

I'm not entirely sure how useful this comment will be to you (it's entirely possible I've made a mistake somewhere), but hopefully it can be of some use.


1
this is pretty awesome. thanks for the outline.
Suresh Venkat

@Suresh: Glad it's useful.
Joe Fitzsimons
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.