Що є доказом цієї нестандартної версії нерівності Азуми?


12

У Додатку B " Підвищення та диференціальна конфіденційність" від Dwork та ін. Автори констатують такий результат без доказів і називають його нерівністю Азуми:

Нехай - випадкові величини в реальному такі, що для кожного ,C1,,Cki[k]

  1. Pr[|Ci|α]=1 і
  2. для кожного (c1,,ci1)Supp(C1,,Ci1) нас є E[CiC1=c1,,Ci1=ci1]β .

Тоді для кожного z>0 маємо Pr[i=1kCi>kβ+zkα]ez2/2 .

У мене виникають проблеми з доведенням цього. Стандартна версія нерівності Азуми каже:

Припустимо, {X0,X1,,Xk} - мартингейл, а |XiXi1|γi майже напевно. Тоді для всіх t>0 маємо Pr[Xkt]exp(t2/(2i=1kγi2)) .

Щоб довести версію нерівності Азуми, заявлену Дворком та ін., Я подумав, що ми повинні взяти X0=0 і Xi=Xi1+CiE[CiC1,C2,,Ci1] . Таким чином, я думаю, що {X0,,Xk} - мартингейл. Але все, що можна сказати, - це |XiXi1|2α майже напевно, правда? Цей фактор з двох викликає неприємності, оскільки це означає, що після заміни ми просто знаходимо, що Pr[i=1kCi>kβ+zk2α]ez2/2 2/2 } , що слабше, ніж висновок, викладений Dwork et al.

Чи є простий трюк, якого мені не вистачає? Чи є твердження Дворка та ін. відсутній фактор два?


Заява у статті є правдивою, але не випливає із "звичайної" версії нерівності Азуми. Проблема полягає в тому, що звичайне твердження передбачає але будь-який інтервал однакової довжини буде робити; немає причин вважати симетричний інтервал. XiXi1[a,a]
Томас

Відповіді:


13

Я не можу знайти посилання, тому я просто накиду сюди доказ.

Теорема. Нехай - реальні випадкові величини. Нехай - константи. Припустимо, що для всіх та всіх у підтримці , ми маємоX1,,Xna1,,an,b1,,bni{1,,n}(x1,,xi1)(X1,,Xi1)

  1. E[Xi|X1=x1,,Xi1=xi1]0 і
  2. P[Xi[ai,bi]]=1 .

Тоді для всіх ,t0

P[i=1nXit]exp(2t2i=1n(biai)2).

Доказ. Визначте . Ми стверджуємо, що Для всіх та маємо За припущенням, і для всіх в підтримціYi=j=1iXj

(*)i{1,,n} λ0     E[eλYi]e18λ2j=1i(bjaj)2.
iλ
E[eλYi]=E[eλYi1eλXi]=E[eλYi1E[eλXi|Yi1]].
μ(yi1):=E[Xi|Yi1=yi1]0P[Xi[ai,bi]]=1yi1Yi1. (Зауважимо, що .) Отже, за леммою Гефдінга , для всіх у підтримці та всіх . Оскільки , ми маємо для всіх , Тепер індукція дає формулу (*) вище.Yi1=X1++Xi1
E[eλXi|Yi1=yi1]eλμ(yi1)+18λ2(biai)2
yi1Yi1λRμ(yi1)0λ0
E[eλYi]E[eλYi1e0+18λ2(biai)2].

Тепер застосуємо нерівність Маркова до і використовуємо наше твердження (*). Для всіх , Нарешті, встановіть щоб мінімізувати вираз правої руки та отримати результат. eλYnt,λ>0

P[i=1nXit]=P[Ynt]=P[eλYneλt]E[eλYn]eλte18λ2i=1n(biai)2eλt.
λ=4ti=1n(biai)2

Як я вже згадував у своєму коментарі, ключова різниця між цим та "звичайним" твердженням про нерівність вимагає , а не . Перший дозволяє отримати більшу гнучкість, а це заощаджує в деяких випадках коефіцієнт 2.Xi[ai,bi]Xi[a,a]

Зауважимо, що випадкові змінні у доказі є супермартінгале. Ви можете отримати звичайну версію нерівності Azuma, взявши Мартингейла , встановивши і (де ), а потім застосувати вищезазначений результат.YiY1,,YnXi=YiYi1[ai,bi]=[ci,ci]P[|YiYi1|ci]=1


У першому рядку доказу це, мабуть, має бути (верхня межа суми як а не ) ....Yi=j=1iXjin
Дугал,

1
Докази наведені також у монографії Дубхасі та Панконесі.
Крістофер Арнсфельт Хансен

@KristofferArnsfeltHansen: Чудово. У вас є посилання?
Томас
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.