Очікувана кількість разів, коли емпіричне середнє значення перевищить значення


11

Враховуючи послідовність iid випадкових величин, скажімо, для , я намагаюся пов'язати очікувану кількість разів емпіричного середнього перевищить значення, , оскільки ми продовжуємо малювати зразки, тобто: Xi[0,1]i=1,2,...,n1ni=1nXic0

T=defj=1nP({1ji=1jXic})

Якщо припустити, що для деяких , ми можемо використовувати нерівність Геффдінга для досягненняc=a+E[X]a>0

Tj=1ne2ja2=1e2a2ne2a21

Що виглядає приємно (можливо), але насправді досить вільне, чи є кращі способи обмеження цього значення? Я думаю, що може бути спосіб, оскільки різні події (для кожного ) явно не є незалежними, я не знаю жодного способу використання цієї залежності. Також непогано було б зняти обмеження, що більше середнього.jc

edit : Обмеження на яке перевищує середнє, може бути знято, якщо ми будемо використовувати Нерівність Маркова наступним чином:c

Tj=1n1jE[X]c=E[X]Hnc
Що є більш загальним, але набагато гіршим за вищезазначене, хоча зрозуміло, що повинен розходитися, коли .TcE[X]

Ваше визначення не узгоджується з вашим описом цього. Якщо " " було видалено, це було б очікуване число перевищення , але як написано, це лінійна комбінація разів . Це явно не очікування, оскільки ймовірності не є взаємовиключними. Наприклад, коли , . Tj×cc0T=n(n+1)/2
whuber

@whuber о, правда, добре, дякую, я це виправив вище.
fairidox

Зауважую, ви змінили верхню межу. Зараз це, мабуть, негативно ;-).
whuber

Чи не слід " " в експоненціалі бути квадратним? - Гаразд, це спрощує домен [0,1]j
Алекос Пападопулос

Відповіді:


1

Це досить ручний підхід, і я дуже вдячний за якийсь коментар до нього (а критичні, як правило, є найбільш корисними). Якщо я правильно розумію, ОП обчислює вибірковий засіб , де кожен зразок містить попередній зразок +1 спостереження з нового rv Позначимо розподіл середнього зразка середнього. Тоді ми можемо писати x¯jFj

T=defj=1n(1Fj(c))=nj=1nFj(c)

Розглянемо приклад розміру , після чого розподіл вибіркового середнього майже в нормі, позначимо його . Тоді ми можемо писатиmG^

T=nj=1mFj(c)j=m+1nG^j(c)<nj=m+1nG^j(c)

Розв’язуючи отримуємо де є нормальним нормальним cdf, - це стандартне відхилення процесу iid, а - його середнє значення. Вставляючи в зв'язане і переставляючи, ми отримуємоG^j(c)

G^j(c)=1Φ(jσ(μc))
Φσμ

T<m+j=m+1nΦ(jσ(a))

Зауважимо, що ця межа залежить також від дисперсії процесу. Це краща межа, ніж представлена ​​у питанні? Це вирішально залежатиме від того, наскільки "швидко" розподіл середнього зразка стає "майже нормальним". Щоб навести числовий приклад, припустимо, що . Припустимо також, що випадкові величини є однаковими в . Тоді і . Розглянемо 10% відхилення від середнього значення, тобто встановити . тоді: вже при пов'язана я пропоную (що має значення для ) стає жорсткішою. Для межа Гёффінга становитьm=30[0,1]σ=112μ=12a=0.05n=34n>30n=10078.5а пропонований я пропоную . Хёфдінга неминуче сходиться до в той час як пов'язаний пропоную Якщо збільшити розбіжність між цими двома межами зменшується , але залишається видимим: для відхилення 20%, , то Хёфдінга неминуче сходиться до в той час як Я пропоную збільшити до (тобто сума нормальних cdfs дуже мало сприяє загальній межі). Дещо більш загально зазначимо, що для зв'язаний Гоффдінг сходить до36.2199.538.5aa=0.149.530.5
n

Hb1e2a21
поки мій прив’язаний до
Abm

Оскільки для малих значень (що, скоріше, цікавить) стає великою кількістю, все ж є випадок, що може перевершити його в герметичності, навіть якщо зразок такий, що середнє значення розподілу вибірки повільно сходить до нормальний розподіл.aHbAb


" (тобто не більше ніж припущенний поріг розміру вибірки, для отримання нормального наближення при розподілі середнього зразка) " про що ви тут говорите?
Glen_b -Встановіть Моніку

Нічого важливого. Коли я пишу деякі рядки вище, правило, щоб розподіл середньої вибірки було "багато", як нормальне, полягає в тому, що нам потрібен принаймні розмір вибірки 30. Отже, для розміру вибірки 100 і 20% відхилення випадок, моя межа тобто - іншими словами, частина пов'язаного сприяє дуже мало. 30.5m+0.5j=m+1nΦ(jσ(a))
Алекос Пападопулос

Якщо ви не можете вказати обставини, за яких це стосується , будь ласка, уникайте називати цю річ правильним принципом у будь-якому загальному сенсі. Цифра 30 абсолютно довільна (як правило, занадто слабка або занадто сильна), і що 30 також виявляється у вашому випадку, я вважаю простим збігом обставин.
Glen_b -Встановити Моніку

1
@Glen_b "30" не було навіть випадковим випадком - я просто використав це для надання числового прикладу. Я не заперечую проти цього питання, мені не подобаються "великі правила" (особливо коли вони сумнівні). Я змінив свою відповідь. Дякуємо за вклад.
Алекос Пападопулос

@Glen_b Дякую за можливо нестаціонарну (тобто довгу) пам’ять!
Алекос Пападопулос
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.