Моделювання конвергенції у ймовірності до постійної


9

Асимптотичні результати неможливо довести за допомогою комп'ютерного моделювання, оскільки вони є твердженнями, що стосуються поняття нескінченності. Але ми повинні мати можливість зрозуміти, що справи дійсно йдуть так, як нам каже теорія.

Розглянемо теоретичний результат

limnP(|Xn|>ϵ)=0,ϵ>0

де Xn - функція n випадкових величин, сказати однаково і незалежно розподілених. Це говорить про те, що Xn сходиться вірогідно до нуля. Архетипний приклад тут, напевно, є випадком, коли Xn - середнє значення вибірки мінус загальне очікуване значення iidrv's вибірки,

Xn=1ni=1nYiE[Y1]

ЗАПИТАННЯ: Як ми могли переконливо показати комусь, що вищезазначене відношення «матеріалізується в реальному світі», використовуючи результати комп’ютерного моделювання з обов'язково обмежених зразків?

Зверніть увагу, що я спеціально обрав конвергенцію на постійну .

Я надаю нижче свій підхід як відповідь, і сподіваюся на кращі.

ОНОВЛЕННЯ: Щось на задній частині голови мене непокоїло - і я дізнався, що. Я розкопав старе питання, де в коментарях до однієї з відповідей тривало найцікавіше обговорення . Там @Cardinal подав приклад оцінювача, що він є послідовним, але його дисперсія залишається ненульовою та кінцевою асимптотикою. Отже, більш жорстким варіантом мого запитання стає: як ми покажемо за допомогою моделювання, що статистика перетворюється на ймовірність до постійної, коли ця статистика підтримує асимптотику ненульової та кінцевої дисперсії?


@Glen_b Отримавши від вас, це еквівалент значка. Дякую.
Алекос Пападопулос

Я думав про це раз у раз, і все, що я придумав, це те, що «концентрація навколо середнього» аргументу; Я сподіваюся, що деякі розумні люди тут встигнуть написати щось цікаве! (+1 звичайно!)
еквалл

Відповіді:


2

Я вважаю функцією розподілу (доповненням у конкретному випадку). Оскільки я хочу використовувати комп’ютерне моделювання, щоб показати, що речі мають тенденцію так, як нам говорить теоретичний результат, мені потрібно побудувати емпіричну функцію розподілуабо емпіричний відносний розподіл частоти, а потім якимось чином показують, що зі збільшенням значень зосередити «все більше і більше» до нуля. P()|Xn|n|Xn|

Щоб отримати емпіричну функцію відносної частоти, мені потрібно (набагато) більше, ніж один зразок, що збільшується в розмірі, оскільки в міру збільшення розміру вибірки розподілзміни для кожного різного . |Xn|n

Отже, мені потрібно генерувати з розподілу , зразків "паралельно", скажімо, у тисячах, кожен з початкових розмірів , скажімо, в межах десятків тисяч. Мені потрібно тоді обчислити значенняз кожного зразка (і для того ж ), тобто отримуємо набір значень .Yimmnn|Xn|n{|x1n|,|x2n|,...,|xmn|}

Ці значення можуть бути використані для побудови емпіричного відносного розподілу частоти. Маючи віру в теоретичний результат, я очікую, що "багато" значеньбуде "дуже близько" до нуля, але, звичайно, не всі. |Xn|

Отже, щоб показати, що значеннячи дійсно крокуємо до нуля у більшій та більшій кількості, мені доведеться повторити процес, збільшивши розмір вибірки, щоб сказати , і показати, що зараз концентрація до нуля "зросла". Очевидно, щоб показати, що він збільшився, слід вказати емпіричне значення для .|Xn|2nϵ

Цього буде достатньо? Чи могли ми якось формалізувати це «підвищення концентрації»? Чи може ця процедура, якщо вона виконується більш кроками "збільшення розміру вибірки", а той, що знаходиться ближче до іншого, дасть нам деяку оцінку щодо фактичної швидкості конвергенції , тобто щось на кшталт "емпіричної маси ймовірності, яка рухається нижче порогової від кожен крок ", скажімо, тисячі? n

Або вивчіть значення порогу, для якого, скажімо, % ймовірності лежить нижче, і подивіться, як це значення зменшується на величину?90ϵ

ПРИКЛАД

Розглянемо, що є і такYiU(0,1)

|Xn|=|1ni=1nYi12|

Спочатку ми генеруємо зразків розміром кожна. Емпіричний відносний частотний розподілвиглядає як m=1,000n=10,000|X10,000|введіть тут опис зображення

і зазначимо, що % значеньменше . 90.10|X10,000|0.0046155

Далі збільшую розмір вибірки до . Тепер емпіричний відносний частотний розподілвиглядає так, і зазначимо, що % значеньзнаходяться нижче . Крім того, зараз % значень падають нижче .n=20,000|X20,000|введіть тут опис зображення91.80|X20,000|0.003710198.000.0045217

Вас переконала б така демонстрація?


3
Ні, я б не переконував жодної такої демонстрації, якби це було все, що пропонується. Він не в змозі відрізнити заявлений результат від результату, при якому є дуже мала кількість забруднення від ненульового розподілу. Будь-яке комп'ютерне моделювання, щоб бути по-справжньому переконливим, повинно супроводжуватися міркуваннями, які б виключали подібні явища. (Нещодавно я провів серію симуляцій, які вийшли до вибірки розміром - це не помилка друку, - але все ще не переконали в результатах, хоча вони були дуже 101000
прихильними

1
@whuber Те, що ви пишете, звучить дуже цікаво. Ці симуляції ви згадали на основі деяких початкових реальних даних, з яких розподілів, де оцінювались, а потім були створені додаткові штучні дані? Або це було штучним з самого початку? Якщо конфіденційність не є проблемою, а час дозволяє, я особисто хотів би побачити Вашу відповідь, яка дає деякий погляд на те, як розвивалися ці симуляції та чому залишається сумнів.
Алекос Пападопулос

1
Це були штучні дані. Я виконав ці симуляції, щоб підтримати коментар на сайті stats.stackexchange.com/questions/104875/… . Ви відразу побачите, як можна виконати таке велике моделювання: щоб створити вибірку з розподілу Бернуллі ви просто отримаєте одне значення з двочленного розподілу. Коли достатньо великий, ви також можете отримати значення з нормального розподілу. Основна хитрість - це робити з точною точністю :-). N(1/2)(N,1/2)N(N/2,N/2)1000
whuber

@Whuber Спасибі, я буду працювати над цим. До речі, запитання, яке ви згадуєте, відповідь на нього та ваші коментарі, змусили мене більш глибоко дослідити як асимптотичний розподіл дисперсії вибірки від ненормальних вибірок, так і застосуваність теореми Слуцького у спосіб, що є використаний у відповіді. Я сподіваюся, що врешті-решт я отримаю якісь результати.
Алекос Пападопулос
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.