Зворотний зв’язаний Чернофф


31

Чи є зворотна межа Черноффа, яка обмежує ймовірність хвоста принаймні настільки великою.

тобто якщо є незалежними біноміальними випадковими змінними та . Тоді ми можемо довести Pr [\ sum_ {i = 1} ^ n X_i \ geq (1+ \ delta) \ mu] \ geq f (\ mu, \ delta, n) для деякої функції f .Х1,Х2,,Хнмк=Е[i=1нХi]Пr[i=1нХi(1+δ)мк]f(мк,δ,н)f


1
Ваш приклад задає занадто багато: при стандартна прив'язка Черноффа показує, що і \ Pr [| T \ cap S_2 | \ sqrt {1.1} \ leq n ^ {1/3}] є максимум \ exp (-cn ^ { 1/3}) для деякої c . p=н-2/3Пр[|ТS1|1.1н1/3]Пр[|ТS2|1.1н1/3]досвід(-cн1/3)c
Колін МакКійлан

Ви маєте рацію, я заплутався, який термін у чернофф-меді має квадрат. Я змінив питання, щоб відобразити слабшу межу. Я не думаю, що це допоможе мені в моїй теперішній заявці, але це може бути цікаво з інших причин.
Ashwinkumar BV

Відповіді:


28

Ось явний доказ того, що стандартна прив'язка Черноффа є тісною до постійних факторів в експоненті для певного діапазону параметрів. (Зокрема, щоразу, коли змінні дорівнюють 0 або 1, і 1 з вірогідністю 1/2 або менше, і ϵ(0,1/2) , а верхня межа Черноффа менша за постійну.)

Якщо ви виявили помилку, будь ласка, повідомте мене про це.

Лема 1. (герметичність, пов'язана з Чернофом) Нехай Х - середнє значення к незалежних, 0/1 випадкових величин (rv). Для будь-якого ϵ(0,1/2] та p(0,1/2] , припускаючи ϵ2pк3 ,

(i) Якщо кожен rv дорівнює 1, ймовірність не більше p , то

Пр[Х(1-ϵ)p]  досвід(-9ϵ2pк).

(ii) Якщо кожен rv дорівнює 1 з вірогідністю принаймні p , то

Pr[X(1+ϵ)p]  досвід(-9ϵ2pк).

Доказ. Ми використовуємо таке спостереження:

Заява 1. Якщо , то ( k1k1(k)  1e2π(k)(kk)k

Доведення твердження 1. За наближенням Стірлінга де , А , [ 1 / ( 12 я + 1 ) , 1 / 12 я ] .i!=2πi(i/e)ieλλ[1/(12i+1),1/12i].

Таким чином, , що є , принаймні QED k!(k)k!!(k)!1

2πк(ке)к2π(е)  2π(к-)(к-е)к-досвід(112к+1-112-112(к-))
  12π(к)(кк-)к-е-1.

Доведення леми 1 частина (i). Без втрати загальності припустимо, що кожна випадкова величина 0/1 у сумі дорівнює 1 з вірогідністю точно . Примітка дорівнює сумі , і .p Pr [ X ( 1 - ϵ ) p ] ( 1 - ϵ ) p k i = 0 Pr [ X = i / k ]Х pПр[Х(1-ϵ)p]i=0(1-ϵ)pкПр[Х=i/к]Пр[Х=i/к]=(кi)pi(1-p)к-i

Виправити . Терміни в сумі збільшуються, тому кожен із термінів з індексом має значення принаймні , тому їх сума має принаймні загальне значення . Для завершення доказу покажемо, що i Pr [ X = / k ] ( ϵ p k - 2 ) Pr [ X = / k ] ( ϵ p k - 2 ) Pr [ X = / k ] exp ( - 9 ϵ=(1-2ϵ)pк+1iПр[Х=/к](ϵpк-2)Пр[Х=/к]

(ϵpк-2)Пр[Х=/к]  досвід(-9ϵ2pк).

Припущення і дають , тому ліва частина зверху є принаймні . Використовуючи пункт 1 для прив'язки , це, у свою чергу, принаймні де і ϵ2pк3epsi ; р до 6 2ϵ1/2ϵpк6( k23ϵpк(к)p(1-p)к- А(к)A = 2АБ B= ( kА=23еϵpк/2πБ=(к)(кк-)к-p(1-p)к-.

Для закінчення показуємо і .B exp ( - 8 ϵ 2 p k )Адосвід(-ϵ2pк)Бдосвід(-8ϵ2pк)

Претензія 2. Адосвід(-ϵ2pк)

Доведення твердження 2. Припущення та увазі (i) .epsi ; & le ; 1 / 2 р до 12ϵ2pк3ϵ1/2pk12

За визначенням, . За (i), . Таким чином, (ii) .p k 12 pk+1pk121.1pk

Заміна правої частини (ii) для в дає (iii) .A A 2AA23еϵpк/2.2π

Припущення, , означає, що , що з (iii) дає (iv) .ϵ ϵ2pк3 A 2ϵpк3А23е3/2.2π0,1

З випливає, що (v) .exp ( - ϵ 2 p k ) exp ( -ϵ2pк3exp(ϵ2pk)exp(3)0.04

(iv) та (v) разом подають вимогу. QED

Претензія 3. .Bexp(8ϵ2pk)

Доказ вимоги 3. Виправити таким чином, що . Вибір передбачає , тому претензія буде тримати до тих пір, поки . Приймаючи кожну сторону цієї останньої нерівності до потужності та спрощуючи, вона рівносильна Підставляючи та спрощуючи, він еквівалентний = ( 1 - δ ) p k δ 2 ϵ B exp ( - 2 δ 2 p k ) - 1 /δ=(1δ)pк
δ2ϵБдосвід(-2δ2pк)-1/=(1-δ)pk(1-δ)(1+δp

pк(к-(1-p)к)к/-1  досвід(2δ2pк).
=(1δ)pkln(1
(1δ)(1+δp1p)1(1δ)p1  exp(2δ21δ).
Беручи логарифм обох сторін і використовуючи двічі, він буде тримати до тих пір, як Ліва частина вище спрощує до , що менше оскільки . QED- δln(1+z)zδ 2 /
δ+δp1p(1(1δ)p1)  2δ21δ.
2 δ 2 / ( 1 - δ ) pδ2/(1p)(1δ)2δ2/(1δ)p1/2

У пунктах 2 та 3 випливає, що . Це означає частину (i) леми.ABexp(ϵ2pk)exp(8ϵ2pk)

Доведення леми 1 частина (ii). Без втрати загальності припустимо, що кожна випадкова величина дорівнює з вірогідністю точно .с1p

Примітка . Виправити . = ( 1 + 2 ε ) р до - 1Pr[X(1+ϵ)p]=i=(1ϵ)pknPr[X=i/k]^=(1+2ϵ)pk1

Останній у загальній сумі принаймні , що становить принаймні . (Доказом цього є те саме, що і для (i), за винятком замінено на і замінено на таким, що .) QED( ε р до - 2 ) Pr [ Х = л / к ] ехр ( - 9 ε 2 р до ) л л & delta ; - & delta ; л = ( 1 + & delta ; ) р доϵpk(ϵpk2)Pr[X=^/k]exp(9ϵ2pk)^δδ^^=(1+δ^)pk


Кілька [помилка обробки математики] s - будь-який шанс виправити їх?
Ар'є

Ті математичні вирази, які використовуються для відображення просто чудово. Чомусь команда \ select не працює в mathjax. Ні \ binom. Наприклад, $ a \ select b $ дає . Імовірно, це помилка в конфігурації математики. Сподіваємось, це скоро буде виправлено. Тим часом див. Лему 5.2 в додатку arxiv.org/pdf/cs/0205046v2.pdf або cs.ucr.edu/~neal/Klein15Number . (ab)
Ніл Янг

22

Беррі-есе теорема може дати хвіст ймовірності нижні межі, до тих пір , як вони вище , ніж .n1/2

Іншим інструментом, яким ви можете скористатися, є нерівність Пейлі-Жигмунда . Це означає, що для будь-якого навіть цілого і будь-якої реальної значення випадкової величини ,XkX

Pr[|X|>=12(E[Xk])1/k]E[Xk]24E[X2k]

Разом з мультиноміальною теоремою для сума випадкових змінних радіамахер Палей-Зігмунд може отримати вам досить сильні нижні межі. Також він працює з випадковими змінними незалежної незалежності. Наприклад, ви легко зрозумієте, що сума 4-мудріх незалежних випадкових величин - з постійною ймовірністю.n n ± 1 Ω ( Xnn±1Ω(n)


14

Якщо ви дійсно не в порядку з обмеженнями сум випробувань Бернуллі (а не, скажімо, обмеженими випадковими змінними), наступне досить чітко.

Нерівність шламу *. Нехай - iid малює з rn Бернуллі з , і нехай буде задано ціле число . Якщо або (a) і , або (b) , то де - cdf стандартної норми. Е ( Х 1 ) = р до п р 1 / 4 п р до п р до п ( 1 - р ) Pr [ Σ я X яK ]1 - Φ ( k - n p{Xi}i=1nE(X1)=pknp1/4нpкнpкн(1-p)Φ

Пр[iХiк]1-Φ(к-нpнp(1-p)),
Φ

(Трактуючи аргумент до як перетворення стандартного нормального, це точно узгоджується з тим, що вам каже CLT; насправді, це говорить нам, що біноміали, що задовольняють умовам теореми, будуть домінувати над відповідними гауссами на верхніх хвостах.)Φ

Звідси ви можете використовувати межі на щоб отримати щось приємніше. Наприклад, у першій книзі Феллера, в розділі про Гаусса, для кожного показано, що де - щільність стандартної норми. У статті Вікіпедії подібні межі є і для "Q-функції".z > 0Φz>0φ

z1+z2φ(z)<1-Φ(z)<1zφ(z),
φ

Окрім цього та того, що сказали інші люди, ви також можете спробувати скористатися біноміалом безпосередньо, можливо, з деяким Стерлінг.

(*) Деякі новіші твердження про нерівність Слуду виключають деякі з цих умов; Я відтворив цю в статті Slud.


7

Теорема де Моєр-Лапласа показує, що такі змінні, як, після відповідного нормалізації та за певних умов, перейде в розподіл до нормального розподілу. Цього достатньо, якщо потрібно постійні нижчі межі.|ТS1|

Для нижчих меж, таких як , вам потрібен трохи тонший інструмент. Ось одна відома мені довідка (але лише випадково - я ніколи не мав можливості використовувати таку нерівність сам). Деякі явні нижні межі щодо хвостових ймовірностей біноміальних розподілів наведені як теорема 1.5 книги " Випадкові графіки " Бели Болобаш, Кембридж, 2-е видання, де подані додаткові посилання на Вступ до ймовірності та його застосування Феллером та Основи ймовірності Рені.н-c


4

Узагальнена теорема Літтлвуда-Оффорда не є саме такою, яку ви хочете, але вона дає те, що я вважаю "зворотним Черноффом", пов'язаним, показуючи, що сума випадкових змінних навряд чи потрапить у малий діапазон навколо якогось конкретного значення (в т.ч. очікування). Можливо, це стане в нагоді.

Формально теорема така.

Узагальнена теорема Літлвуда-Оффорда : Нехай і - дійсні числа, такі, що для і нехай є незалежними випадковими змінними, які мають значення нуль і одне. Для припустимо, що для всіх . Тоді для будь-якого , Де - константа залежно лише від . s > 0 | a i | s 1 i n X 1 , , X n 0 < pа1,,анс>0|аi|с1iнХ1,,Хн0<p12pПр[Хi=0]1-p1iнrR

Пр[ri=1наiХi<r+с]cpн
cpp

3
Іншим може бути корисно знати, що цей тип результату також відомий як "нерівність малих кульок", і Нгуен і Ву мають надзвичайне опитування людей.math.osu.edu/nguyen.1261/cikk/LO-survey.pdf . Моя точка зору тут трохи відрізняється від вашої. Я вважаю, що "зворотний Чернофф" пов'язаний як давання нижчої оцінки маси ймовірності малої кулі близько 0. Я вважаю, що невелика нерівність кулі як якісна, що кажучи про те, що ймовірність малого кулі максимальна за рахунок кулі при 0. Зворотні межі Черноффа, як правило, простіше довести, ніж невеликі нерівності з м'ячем.
Сашо Ніколов

3

Експонент у стандартній межі Чорноффа, як зазначено у Вікіпедії, є щільним для випадкових змінних 0/1. Нехай і нехай - це послідовність незалежних випадкових величин, така що для кожного , і . Тоді для кожного , 0<p<1Х1,Х2,iПр[Хi=1]=pПр[Хi=0]=1-pε>0

2-D(p+εp)нн+1Пр[i=1нХi(p+ε)н]2-D(p+εp)н.

Тут , що є розбіжністю Куллбека-Лейблера між випадковими Бернуллі змінні з параметрами і .D(ху)=хжурнал2(х/у)+(1-х)журнал2((1-х)/(1-у))ху

Як вже було сказано, верхня межа нерівності, наведеної вище, доведена у Вікіпедії ( https://en.wikipedia.org/wiki/Chernoff_bound ) під назвою "Теорема Черноффа-Гоффдінга, форма добавки". Нижню межу можна довести, наприклад, "методом типів". Див. Лему II.2 в [1]. Також це висвітлено в класичному підручнику з теорії інформації Ковер та Томаса.

[1] Імре Цісар: Метод типів. Угоди IEEE з інформаційної теорії (1998). http://dx.doi.org/10.1109/18.720546


Варто також зазначити, що , а для загального випадку це . Це показує, що при типовий зв'язаний гострий. (І коли для ). D(p+δpp)=p2-2pδ2+О(δ3)p=1/212δ2+О(δ4)δ=О(н-1/3)е-Сδ2δ=О(н-1/4)p=1/2
Thomas Ahle
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.