Очікування квадратного кореня суми незалежних квадратних рівномірних випадкових величин


9

Нехай є незалежними та однаково розподіленими стандартними однорідними випадковими змінними.X1,,XnU(0,1)

Let Yn=inXi2I seek: E[Yn]


Очікування легко:Yn

E[X2]=01y2y=13E[Yn]=E[inXi2]=inE[Xi2]=n3

Тепер про нудну частину. Щоб застосувати LOTUS, мені знадобиться pdf . Звичайно, pdf сума двох незалежних випадкових величин - це згортання їх pdfs. Однак тут у нас є випадкових змінних, і я думаю, що згортання призведе до ... висловленого висловлення (жахливий каламбур призначений). Чи є розумніший спосіб?Ynn

Я вважаю за краще правильне рішення , але якщо це неможливо чи занадто складне, асимптотичне наближення для великого може бути прийнятним. По нерівності Дженсена я це знаюн

E[Yn]=n3E[Yn]

Але це мені не дуже допомагає, якщо я не можу знайти також нетривіальну нижню межу. Зауважте, що CLT тут не застосовується безпосередньо, оскільки у нас квадратний корінь суми незалежних RV, а не просто суми незалежних RV. Можливо, тут можуть бути інші граничні теореми (які я ігнорую), які тут можуть бути корисними.


3
Дивіться це питання для асимптотичного результату: stats.stackexchange.com/questions/241504/…
С. Catterall

4
Я отримую на основі вищезазначеного питання. E[Yn]n3115
S. Catterall Відновіть Моніку

2
Я не думаю, що я використовував би будь-який із підходів, описаних у цій відповіді (яких існує більше двох!) :-). Причина полягає в тому, що ви можете скористатися простими, простими моделюваннями, щоб оцінити очікування, тоді як аналітичне рішення видається недосяжним. Мені дуже подобається підхід @ S.Catterall (+1 за це рішення, про яке я раніше не читав). Моделювання показує, що це добре працює навіть для малих . н
whuber

3
Моделювання варто зробити :-). Накресліть різницю між імітованим середнім та приблизною формулою проти . Це наочно покаже, наскільки добре наближається функція . нн
whuber

4
Чітко а наближення дає . У цьому випадку було б правильним. Але наближення покращується після цього. Е[Y1]=0,513-115=4150,51613112
Генрі

Відповіді:


11

Один із підходів - спочатку обчислити функцію, що генерує момент (mgf) Yn визначені Yn=U12++Un2 де Ui,i=1,,n є незалежними та однаково розподіленими стандартними однорідними випадковими змінними.

Коли ми маємо це, ми можемо це бачити

EYn
є дробовим моментом Yн порядку α=1/2. Тоді ми можемо використовувати результати з статті Ноель Крессі та Марінуса Боркента: "Функція, що генерує момент, має свої моменти", Журнал статистичного планування та висновок 13 (1986) 337-344, який дає дробові моменти через дробову диференціацію функції, що генерує момент. .

Перший момент, що генерує функцію U12, яку ми пишемо М1(т).

М1(т)=ЕетU12=01етх2хгх
і я оцінив, що (за допомогою Клена і Вульфрама Альфи) дати
М1(т)=ерф(-т)π2-т
де i=-1- уявна одиниця. (Вольфрам Альфа дає подібну відповідь, але з точки зору інтеграла Доусона. ) Виявляється, нам найбільше потрібна справа длят<0. Зараз легко знайти mgfYн:
Мн(т)=М1(т)н
Потім для результатів з цитованої роботи. Длямк>0 вони визначають мкінтеграл го порядку функції f як
Iμf(t)Γ(μ)1t(tz)μ1f(z)dz
Тоді для α>0 і неінтегральний, n додатне ціле число, і 0<λ<1 такий як α=nλ. Тоді похідне відf порядку α визначається як
Dαf(t)Γ(λ)1t(tz)λ1dnf(z)dzndz.
Тоді вони констатують (і доводять) наступний результат для позитивної випадкової величини X: Припустимо MX(мгф) визначено. Тоді дляα>0,
DαMX(0)=EXα<
Тепер ми можемо спробувати застосувати ці результати до Yn. Зα=1/2 ми знайшли
EYn1/2=D1/2Mn(0)=Γ(1/2)10|z|1/2Mn(z)dz
де простий позначає похідну. Клен дає таке рішення:
0n(erf(z)π2ezz)en(2ln2+2ln(erf(z))ln(-z)+ln(π))22π(-z)3/2ерф(-z)гz
Я покажу сюжет цього очікування, зробленого у клена з використанням числової інтеграції, разом із приблизним рішенням А(н)=н/3-1/15з якогось коментаря (і обговорювалося у відповіді @Henry). Вони надзвичайно близькі:

Порівняння точне та приблизне

Як доповнення, графік процентної помилки:

Відносна похибка (відсотки) у наведеній графіці

Вище о н=20наближення близьке до точного. Нижче використаний код клена:

int( exp(t*x)/(2*sqrt(x)), x=0..1 ) assuming t>0;
int( exp(t*x)/(2*sqrt(x)), x=0..1 ) assuming t<0;
M := t -> erf(sqrt(-t))*sqrt(Pi)/(2*sqrt(-t))
Mn := (t,n) -> exp(n*log(M(t)))
A  :=  n -> sqrt(n/3 - 1/15)
Ex :=  n ->   int( diff(Mn(z,n),z)/(sqrt(abs(z))*GAMMA(1/2) ), z=-infinity..0 ,numeric=true)

plot([Ex(n),A(n)],n=1..100,color=[blue,red],legend=[exact,approx],labels=[n,expectation],title="expectation of sum of squared uniforms")
plot([((A(n)-Ex(n))/Ex(n))*100],n=1..100,color=[blue],labels=[n,"% error"],title="Percentage error of approximation")

1
дуже цікаво. Якщо ви можете додати кілька сюжетів, це буде чудовою відповіддю. Однак я зазначу одну чітку перевагу наближення CLT тут. Наближення наочно показує, щоЕ[Yн] росте як н коли н. Рішення Maple не робить (або, принаймні, я не можу це зрозуміти).
DeltaIV

5

Як розширений коментар: тут здається, що це зрозуміло Е[Yн]=Е[iХi2] починається з Е[Yн]=12=н3-112 коли н=1 а потім підходи н3-115 як н збільшується, пов'язане з дисперсією Yн падіння з 112 назустріч 115. Моє пов'язане запитання, на яке відповів S.Catterall, дає виправдання длян3-115 асимптотичний результат на основі кожного Хi2 маючи середнє значення 13 і дисперсія 445, а розподіл приблизно і асимптотично нормальний.

Це питання ефективно стосується розподілу відстаней від початку випадкових точок у н-розмірна одиниця гіперкуба [0,1]н. Це схоже на питання про розподіл відстаней між точками в такому гіперкубі , тому я можу легко адаптувати те, що я там робив, щоб показати щільність для різнихн з 1 до 16використовуючи числову згортку. Длян=16, запропоноване нормальне наближення, показане червоним кольором, добре підходить і від н=4 ви можете побачити криву дзвону, що з'являється

введіть тут опис зображення

Для н=2 і н=3 ви отримуєте різкий пік в режимі 1з тим, що виглядає як однакова щільність в обох випадках. Порівняйте це з розподіломiХi, де показана крива дзвону н=3 і де дисперсія пропорційна н


2
Майже постійна дисперсія призводить до можливих контрінтуїтивних результатів. Наприклад, сн=400, Y400 (відстань від початку початку випадкової точки в 400-вимірний одиничний гіперкуб) може приймати будь-яке значення 0 до 20 але 94% випадків буде між 11 і 12 і практично всі між ними 10 і 13
Генрі

1
насправді це трохи контрінтуїтивно. Через прокляття розмірності я очікував, що переважна більшість точок буде близько до кутів (усвідомленняу400 вул у400=20). Натомість виглядає так, що переважна більшість точок далекі від походження, але далеко не кути. Імовірно, помилка полягає в тому, що ми повинні враховувати відстань від центру гіперкуба , а не відстань від початку , яка просто один із куточків гіперкуба.
DeltaIV

3
@DeltaIV: Якщо ви зробите свою сторону гіперкубів 2 тому [-1,1]ні вимірюючи походження, ви отримуєте точно однаковий розподіл, очікування та дисперсію. Зн=400 Більшість точок у цій великій гіпекубі буде близькою до межі цієї гіперкуби (типова відстань порядку порядку 0,02), але не близько до його кутів (типова відстань до найближчої 11 або 12знову)
Генрі

1
це має сенс - у мене не було часу займатися математикою, але інтуїтивно я очікував подібних результатів U([-1,1]). Я очікував, що (вибачте за каламбур) зміниться постійним фактором, але, як я вже сказав, я не встиг це перевірити.
DeltaIV
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.