Сума продуктів випадкових змінних Rademacher


9

Нехай - незалежні випадкові величини, що приймають значення або з вірогідністю 0,5 кожна. Розглянемо суму . Я бажаю на верхній межі ймовірності . Найкраща межа, яку я маю зараз, - це де c - універсальна константа. Це досягається нижчим обмеженням ймовірності Pr (| x_1 + \ крапки + x_n | <\ sqrt {t}) та Pr (| y_1 + \ крапки + y_n | <\ sqrt {t}) шляхом застосування простих меж Черноффа. Чи можу я сподіватися отримати щось, що значно краще, ніж це пов'язане? Для початку я можу принаймні отриматиx1xa,y1yb+11S=i,jxi×yjP(|S|>t)2ectmax(a,b)cPr(|x1++xn|<t)Pr(|y1++yn|<t)ectab . Якщо я можу отримати субгаусські хвости, які, мабуть, були б найкращими, але чи можна це очікувати (я не думаю, але не можу придумати аргумент)?


Чи розглядали ви, як застосувати прив'язку Чорноффа безпосередньо до S ? Ви можете зробити щось із
E[exp(λS]=E[λijXiYj]=E[λ(iXi)(jYj)]
Діліп Сарват

У вашій межі для є очевидне поліпшення , тому ймовірність повинна дорівнювати нулю. Мені здається, що "субгаусський" хвіст :-). Також здається, що ваше обмеження є невірним: змінні, які постійно відповідають умовам цього питання. Для і ймовірність , але ваша оцінка є асимптотично , як росте великий. t>ab1a=bt=a2112exp(ca)0a
whuber

Імовірність того, що всі змінні дорівнюють 1, знижується експоненціально. Я не думаю, що я розумію ваш коментар. Для і зазначений я пов'язаний досить тривіально правдивий, оскільки ймовірність суми більша за дорівнюєa=bt=a21t212(a1)eln(2)c(a1/a)
користувач1189053

1
Мені дуже шкода помилки. Я думав, що я згадував рівномірно вище. Отже, p = 1/2, і ми можемо взяти a і b більше, ніж будь-яка константа (якщо потрібно) для нерівності, яку потрібно
дотримати

2
Якщо мої очі не обманюють мене, ви розглядаєте суму продуктів, а не продукт сум. :-)
кардинал

Відповіді:


7

Алгебраїчне відношення

S=i,jxiyj=ixijyj

виставляє як добуток двох незалежних сум. Оскільки і є незалежними змінними Бернуллі , є двочленною змінною, яка був подвоєний і зміщений. Тому його середнє значення дорівнює а його дисперсія - . Аналогічно має середнє значення і дисперсію . Давайте їх стандартизуємо зараз, визначившиS(xi+1)/2(yj+1)/2(1/2)X=i=1axi(a,1/2)0aY=j=1byj0b

Xa=1ai=1axi,

звідки

S=abXaXb=abZab.

До високої (і кількісно) ступеня точності, оскільки зростає великий наближається до стандартного нормального розподілу. Тому наблизимо як добуток двох стандартних нормалей.aXaSab

Наступний крок - це помітити

Zab=XaXb=12((Xa+Xb2)2(XaXb2)2)=12(U2V2).

кратно різниці квадратів незалежних стандартних нормальних величин і . Розподіл можна обчислити аналітично (шляхом інвертування характерної функції ): його pdf пропорційний функції Бесселя порядку нуля, . Оскільки ця функція має експоненціальні хвости, ми відразу робимо висновок, що для великих і та фіксованих немає кращого наближення до ніж зазначено у питанні.UVZabK0(|z|)/πabtPra,b(S>t)

Існує деякий простір для вдосконалення, коли один (принаймні) з і не великий або в точках у хвості близьких до . Прямі обчислення розподілу показують викривлене звуження вірогідності хвоста у точках, значно більших, ніж , приблизно за . Ці лінійно-лінійні графіки CDF для різних значень (наведені у заголовках) та (приблизно в межах тих же значень, що й , виділених кольором у кожному графіку) показують, що відбувається. Для довідки графік граничногоabS±abSababmax(a,b)SabaK0розподіл показано чорним кольором. (Оскільки симетричний навколо , , тому достатньо подивитися на негативний хвіст.)S0Pr(S>t)=Pr(S<t)

Цифри

Зі збільшенням CDF стає ближче до еталонної лінії.b

Характеризація та кількісна оцінка цієї кривизни вимагає більш тонкого аналізу нормального наближення до біноміальних змінних.

Якість наближення функції Бесселя стає чіткішою в цих збільшених частинах (правого верхнього кута кожної ділянки). Ми вже досить далеко у хвости. Хоча логарифмічна вертикальна шкала може приховати суттєві відмінності, очевидно, до того часу, коли досягне наближення добре для .a500|S|<ab

Вставки


R код для обчислення розподілуS

Далі буде потрібно кілька секунд, щоб виконати. (Він обчислює кілька мільйонів ймовірностей для 36 комбінацій і .) На повільніших машинах опустіть більше одного або двох значень та і збільшуйте нижню межу побудови графіку від до приблизно .abab1030010160

s <- function(a, b) {
  # Returns the distribution of S as a vector indexed by its support.
  products <- factor(as.vector(outer(seq(-a, a, by=2), seq(-b, b, by=2))))
  probs <- as.vector(outer(dbinom(0:a, a, 1/2), dbinom(0:b, b, 1/2)))
  tapply(probs, products, sum)
}

par(mfrow=c(2,3))
b.vec <- c(51, 101, 149, 201, 299, 501)
cols <- terrain.colors(length(b.vec)+1)
for (a in c(50, 100, 150, 200, 300, 500)) {
  plot(c(-sqrt(a*max(b.vec)),0), c(10^(-300), 1), type="n", log="y", 
       xlab="S/sqrt(ab)", ylab="CDF", main=paste(a))
  curve(besselK(abs(x), 0)/pi, lwd=2, add=TRUE)
  for (j in 1:length(b.vec)) {
    b <- b.vec[j]
    x <- s(a,b)
    n <- as.numeric(names(x))
    k <- n <= 0
    y <- cumsum(x[k])
    lines(n[k]/sqrt(a*b), y, col=cols[j], lwd=2)
  }
}

1
Дуже красиво зроблено! Можна отримати точну форму для cdf продукту двох стандартних норм .. для негативного хвоста, це так 1/2 (1 + y BesselK[0,-y] StruveL[-1, y] - y BesselK[1,-y] StruveL[0, y]). Було б цікаво побачити, як: (а) виконує обмеження ОП та (б) виконує ваше нормальне наближення для випадку, який ми розглядали вище, тобто отриманого за допомогою точного дискретного рішення PMF. a=5,b=7
вовчі

1
@wolfies Так, я отримав і цей вираз: він інтегрує хвіст . Оскільки точний розподіл не відходить від нього в крайніх хвостах, здається, що далі аналізувати цей інтеграл не варто. Наступним логічним кроком є ​​більш вибагливий аналіз хвостів, що означає виходити за рамки нормального наближення. K0
whuber

3

Коментар: Я відредагував заголовок, намагаючись краще відобразити, який тип резюме розглядається у питанні. Будь-хто сміється повторно редагувати.

Мотивація: Гадаю, немає необхідності встановлювати верхню межу, якщо ми можемо отримати розподіл. ( ОНОВЛЕННЯ : Ми не можемо побачити коментарі та відповіді Вюбера).|Sab|

Позначимо . Неважко перевірити, що 'мають однаковий розподіл, як ' і '. Функція генерування моменту єZk=XiYj,k=1,...,abZXY

MZ(t)=E[ezt]=12et+12et=cosh(t)

Більше того, 'є для початку парно незалежними: змінна (індекси можуть бути будь-якими звичайно), має підтримку з відповідними ймовірностями . Його функція генерування моменту єZW=Z1+Z2{2,0,2}{1/4,1/2,1/4}

MW(t)=E[e(z1+z2)t]=14e2t+12+14e2t==14(e2t+1)+14(e2t+1)=142etcosh(t)+142etcosh(t)=cosh(t)cosh(t)=MZ1(t)MZ2(t)

Я спробую підозрювати, що повна незалежність дотримується наступного (чи це очевидно для мудріших?): Для цієї частини . Тоді за ланцюговим правилом Zij=XiYj

P[Zab,...,Z11]=P[ZabZa,b1,...,Z11]...P[Z13Z12,Z11]P[Z12Z11]P[Z11]

За парною незалежністю ми маємо . Розглянемо . і є незалежними умовними тому у нас друга рівність за парною незалежністю. Але це означає, що цеP[Z12Z11]=P[Z12]
P[Z13,Z12Z11]Z13Z12Z11

P[Z13Z12,Z11]=P[Z13Z11]=P[Z13]

P[Z13Z12,Z11]P[Z12Z11]P[Z11]=P[Z13,Z12,Z11]=P[Z13]P[Z12]P[Z11]

Etc (я думаю). ( ОНОВЛЕННЯ : Я думаю, що неправильно . Незалежність, мабуть, стосується будь-якої трійки, але не для всієї групи. Отже, що далі - це лише виведення розподілу простої випадкової прогулянки, а не правильна відповідь на питання - див. Wolfies 'і Відповіді Вюбера).

Якщо дійсна повна незалежність, ми маємо завдання вивести розподіл суми iid дихотомічного rv

Sab=k=1abZk

що схоже на просту випадкову прогулянку , хоча без чіткого трактування останньої як послідовності.

Якщо підтримка буде парними цілими числами в включаючи нуль, тоді як якщо підтримка буде непарними цілими числами в , без нуля. ab=evenS[ab,...,ab]ab=oddS[ab,...,ab]

Ми розглядаємо випадок . Позначимо - число , яке приймає значення . Тоді підтримку можна записати . Для будь-якого , ми отримаємо унікальне значення для . Крім того, через симетричні ймовірності та незалежність (чи просто ?) Всі можливі спільні реалізації змінних є вірогідними. Отже, ми підраховуємо і знаходимо, що функція маси ймовірностей дорівнює,ab=odd
mZ1SS{ab2m;mZ+{0};mab}mSZ{Z1=z1,...,Zab=zab}S

P(S=ab2m)=(abm)12ab,0mab

Визначивши , і непарне число за побудовою, і типовий елемент опори , маємоsab2mS

P(S=s)=(ababs2)12ab

Перехід до, оскільки якщо , розподіл симетричний навколо нуля, не розподіляючи ймовірнісну масу на нуль, і тому розподілотримується шляхом "складання" графіка щільності навколо вертикальної осі, по суті подвоєння ймовірностей для позитивних значень,|S|ab=oddS|S|

P(|S|=|s|)=(ababs2)12ab1

Тоді функція розподілу є

P(|S||s|)=12ab11is,iodd(ababi2)

Тому для будь-якого реального , , отримаємо необхідну ймовірність t1t<ab

P(|S|>t)=1P(|S|t)=112ab11it,iodd(ababi2)

Зауважте, що вказівка гарантує, що сума буде дорівнювати значенням, включеним у підтримку- Наприклад, якщо ми встановимо , все одно буду працювати до , оскільки це обмежено непарним, крім того, що це ціле число.i=odd|S|t=10.5i9


Кількість негативних значень у має бути парним . Тому ці чотири випадкові величини (я припускаю, що це чотири ваших s - позначення незрозумілі) не є незалежними. (X1Y1,X1Y2,X2Y1,X2Y2)Z
whuber

@whuber Дякую Проблема (моя проблема, тобто) полягає в тому, що я продовжую отримувати незалежність у будь-якому конкретному прикладі, який я розробляю. Я опрацюю конкретні чотири змінні, які ви пишете.
Алекос Пападопулос

Так, це складно, оскільки окремі s попарно незалежні і (я вважаю) будь-які три окремі s також незалежні. (Я підтримав вашу відповідь через її творчу атаку на проблему, і я сподіваюся, що помиляюся в моїй оцінці відсутності незалежності!)ZZ
whuber

@whuber Ще раз спасибі Ваубер, це дійсно добре. Я думаю, що нам потрібно для того, щоб виведення розподілу було дійсним, це те, що всі події є безперечними. Чи можливо мати таке майно, коли спільна незалежність не вдається? Я маю на увазі, що спільна незалежність є достатньою для забезпечення рівності, але чи це також необхідно? S{k=1abZk}
Алекос Пападопулос

Боюся, я не розумію вашої позначення, яка, мабуть, посилається на перетин випадкових змінних (що б це не означало).
whuber

3

Не відповідь, а коментар до цікавої відповіді Алекоса, який занадто довгий, щоб вміститись у поле для коментарів.

Нехай є незалежними випадковими змінними Rademacher, і нехай є незалежними випадковими змінними Rademacher. Алекос зазначає, що:(X1,...,Xa)(Y1,...,Yb)

Sab=k=1abZkwhereZk=XiYj

"… Виглядає як звичайна випадкова прогулянка ". Якби це була звичайна випадкова прогулянка, то розподіл було б симетричним "дзвониково-одномодовим" навколо 0.S

Щоб проілюструвати, що це не проста випадкова прогулянка, ось коротке порівняння Монте-Карло:

  • трикутні точки: моделювання Монте-Карло pmf з задане іSa=5b=7
  • круглі точки: моделювання в Монте-Карло простої випадкової прогулянки з кроківn=35

введіть тут опис зображення

Зрозуміло, що - не проста випадкова прогулянка; також зауважте, що S не розподіляється на всі парні (або непарні) цілі числа.S

Монте Карло

Ось код (в Mathematica ), який використовується для генерації єдиної ітерації суми , заданої і :Sab

 SumAB[a_, b_] :=  Outer[Times, RandomChoice[{-1, 1}, a], RandomChoice[{-1, 1}, b]] 
                         // Flatten // Total 

Тоді 500 000 таких шляхів, скажімо, коли і , можна генерувати за допомогою:a=5b=7

 data57 = Table[SumAB[5, 7], {500000}];

Домен підтримки для цієї комбінації і є:ab

{-35, -25, -21, -15, -9, -7, -5, -3, -1, 1, 3, 5, 7, 9, 15, 21, 25, 35}

1
+1 Симуляція (або якийсь такий конкретний приклад) давно потрібна, щоб дати нам орієнтир для подальшого аналізу. Ваше моделювання можна зробити набагато ефективнішим (приблизно в 25 разів швидше), зазначивши, що чинники як . Це одразу пояснює, чому в діаграмі трикутника не може з’являтися достатньо великих простих значень - і насильно демонструє, що не може мати розподілу "випадкової прогулянки" (масштабований двочлен). S(ixi)(jyj)S
whuber

1
Замість моделювання ви можете швидко отримати точну відповідь (для aі bменш ніж 1000, так чи інакше) , як rademacher[a_] := Transpose[{Range[-a, a, 2], Array[Binomial[a, #] &, a + 1, 0] /2^a}]; s[a_, b_] := {#[[1, 1]], Total[#[[;; , 2]]]} & /@ GatherBy[Flatten[Outer[Times, rademacher[a], rademacher[b], 1], 1], First]; ListLogPlot[s[5, 7]] Спробуйте, скажімо, s[100,211].
whuber

@whuber знову перший коментар - ваша факторизація дуже акуратна! :) На моєму Mac, використовуючи: ......... WHuberSumAB[a_, b_] := Total[RandomChoice[{-1, 1}, a]] * Total[RandomChoice[{-1, 1}, b]]... це вдвічі швидше, ніж Outerпідхід. Цікаво, який код ви використовуєте? [Звичайно, обидва підходи можна зробити швидше, використовуючи ParallelTableтощо]
воює

Спробуйте це: sum[n_, a_, b_] := Block[{w, p}, w[x_] := Array[Binomial[x, #] &, x + 1, 0] /2^x; p[x_] := RandomChoice[w[x] -> Range[-x, x, 2], n]; p[a] p[b]]. Тоді час Tally[sum[500000, 5, 7]]. Для Raficianodos наступне робить те ж саме , і займає лише 50% більше , ніж Mathematica : s <- function(n, a, b) (2 * rbinom(n, a, 1/2) - a)*(2 * rbinom(n, b, 1/2) - b); system.time(x <- table(s(5*10^5, 5, 7))); plot(log(x), col="#00000020").
whuber

@whuber - повторно коментар2 - точний pmf: значить, у вас є , де кожна сума , і тому у нас є добуток двох біномів. Чому б не написати це як відповідь !? - це красиво, акуратно, елегантно і корисно ...S=(iXi)(jYj)
вонковується
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.