Якщо


9

Припустимо наступне налаштування:
Нехай Zi=min{ki,Xi},i=1,...,n . Також XiU[ai,bi],ai,bi>0 . Більше того, ki=cai+(1c)bi,0<c<1 тобто ki - це опукла комбінація меж відповідних опор. c є загальним для всіх i .

Я думаю, що я маю право на розподіл Zi правильно: це змішаний розподіл .
Він має суцільну частину,

Xi[ai,ki),Zi=XiPr(Zizi)=ziaibiai
а потім розрив і дискретна частина, де концентрація маси ймовірності:
Pr(Zi=ki)=Pr(Xi>ki)=1Pr(Xiki)
=1kiaibiai=1(1c)(biai)biai=c

Так у всіх

FZi(zi)={0zi<aiziaibiaiaizi<ki1kizi

тоді як для змішаної функції "дискретна / безперервна" маса / щільність вона дорівнює 0 за межами інтервалу [ai,ki] , вона має суцільну частину, яка є щільністю рівномірного U(ai,bi) , 1biai але для aizi<ki , і вона концентрує позитивну масу ймовірності c>0 при zi=ki .

Загалом, це підсумовує єдність щодо дійсності.

Я хотів би мати можливість вивести або сказати щось про розподіл та / або моменти випадкової змінної Sni=1nZi , як n .

Скажімо, якщо незалежні, це виглядає як як . Чи можу я «ігнорувати» цю частину, навіть як наближення? Тоді мені залишиться випадкова величина, яка знаходиться в інтервалі , схожий на суму цензурованої форми, на шляху до того, щоб стати "нецензурованою", і, можливо, якась центральна межа теореми ... але я, мабуть, розходяться, а не сходяться тут, так, якісь пропозиції?XiPr(Sn=inki)=cn0n[i=1nai,i=1nki)

PS: Це питання є актуальним. Виведення розподілу суми цензурованих змінних , але відповідь @Glen_b не те, що мені потрібно - я повинен працювати над цим аналітичним шляхом, навіть використовуючи наближення. Це дослідження, тому будь ласка, ставитесь до нього як до домашнього завдання - загальні пропозиції чи посилання на літературу є досить хорошими.


Якщо вам це потрібно, запишіть розподіл як , з відповідним , в якій - множина Бореля. ZiμZi(B)=P(ZiB)=Bg(t)dt+cIB(ki)gB
Дзен

@Zen Я вже писав у запитанні, що розповсюдження припиняється. Також RHS з дає зрозуміти, що це означає щільність у , але є ймовірність для і я віддаю перевагу компактним позначенням. ff[ai,ki)ki
Алекос Пападопулос

Наскільки мені відомо, це позначення з було pdf та pmf не існує; і ми маємо належну математичну мову, щоб точно описати змішані розподіли. Я сумніваюся, що ця нотація буде прийнята, коли ви опублікуєте своє дослідження. Просто моя думка, звичайно. Ви завжди повинні робити це так, як вам подобається. f
Дзен

@Zen Publishing - це довгий шлях - і справді, рецензенти нахмуряються, коли бачать невстановлену нотацію. Це лише скорочення, коли хочеться описати ступінчастий розподіл у багатьох рядках. Немає «аргументу на користь» і проти встановленої нотації, як, наприклад, той, який ви використовували в попередньому коментарі.
Алекос Пападопулос

Відповіді:


5

Я б дотримувався підказки Генрі і перевіряв Ляпунова з . Факт змішування розподілів не повинен бути проблемою, доки поведінка та поводиться належним чином. Моделювання конкретного випадку, коли , , для кожного показує, що нормальність нормальна.δ=1aibiai=0bi=1ki=2/3i1

xbar <- replicate(10^4, mean(pmin(runif(10^4), 2/3)))
hist((xbar - mean(xbar)) / sd(xbar), breaks = "FD", freq = FALSE)
curve(dnorm, col = "blue", lwd = 2, add = TRUE)

CLT


Справді досить нормально. Добре знати. Звичайні умови для CLT тут ніколи не були проблемою, моє питання - чи існували інші, можливо, тонкі проблеми, які закручували асимптотичний результат і вимагали модифікованого CLT. Ваше моделювання показує, що дійсно дискретний розрив стає незначним у ймовірності, оскільки більше змінних входить до суми.
Алекос Пападопулос

Нічого конкретного, але вони не створюють жодних проблем. Подумайте про них, як добре поводяться кінцеві числа, незалежні від індексу . Вони можуть збільшуватися або зменшуватися в міру зростання (немає конкретного правила), і жодне з них непропорційно більше, ніж інші ... вони представляють різницю за розмірами все-таки "порівнянних" сутностей. Тож стан Ліндберга, безумовно, дотримуєтьсяii
Алекос Пападопулос,

Приємно. Успіхів у наступних кроках. Виглядає як цікава проблема.
Дзен

3

Підказки:

Якщо припустити, що є фіксованим і незалежними, то ви можете обчислити середнє значення та дисперсію кожного : наприклад і ви знаєте . cXiμiσi2Ziμi=E[Zi]=cai+ki2+(1c)kiki=cai+(1c)bi

Тоді, якщо та не зростають занадто швидко, ви можете використовувати умови Ляпунова або Ліндеберга, щоб застосувати центральну граничну теорему з висновком, що у розподілі до стандартного нормального, або в ручному сенсом приблизно нормально розподіляється із середнім та дисперсія .aibi11nσi2(1nZi1nμi)1nZi1nμi1nσi2


Дякую. Проблеми зaiі і biвони не ростуть з індексом, вони просто коливаються навколо. Отже, ви по суті говорите, що CLT може охоплювати також випадкові змінні зі змішаним розподілом?
Алекос Пападопулос

Якщо, наприклад, ai і biбули виправлені, тоді у вас були б незалежні однаково розподілені випадкові величини з кінцевою дисперсією, тому застосовуватиметься центральна гранична теорема. Це розподіл суміші чи ні, це не впливає на цей результат. Я говорю про те, що ви можете поширити це на випадки, коли випадкові змінні незалежні, але не розподілені однаково, за умови, що засоби та відхилення залишаються розумними.
Генрі

2

Моє головне занепокоєння в цьому питанні полягало в тому, чи можна застосовувати CLT «як завжди» у випадку, коли я розглядаю. Користувач @Henry запевнив, що можна, користувач @Zen показав це за допомогою симуляції. Таким чином заохочується, я зараз доведемо це аналітично.

Я спершу збираюся переконатися, що ця змінна зі змішаним розподілом має "звичайну" функцію генерації моменту. Позначимоμi очікуване значення Zi, σi його стандартне відхилення, а також по центру та масштабуванню версії Zi від Z~i=Ziμiσi.
Застосовуючи формулу змінної змінної, ми виявляємо, що неперервна частина є

fZ~(z~i)=σifZ(zi)=σibiai
Функція, що генерує момент Z~i має бути
M~i(t)=E(ez~it)=ez~itdFZ~(z~i)=a~ik~iσiez~itbiaidzi+cek~it

M~i(t)=σibiaiek~itea~itt+cek~it
з
к~i=кi-мкiσi,а~i=аi-мкiσi

Використовуючи прайси для позначення похідних, якщо ми правильно вказали функцію генерування моменту, тоді нам слід отримати

M~i(0)=1,M~i(0)=E(Z~)=0M~i(0)=E(Z~i2)=Var(Z~i)=1
оскільки це централізована і масштабована випадкова величина.
І дійсно, обчислюючи похідні, застосовуючи правило L'Hopital багато разів (оскільки значення MGF в нулі необхідно обчислювати через межі), і здійснюючи алгебраїчні маніпуляції, я перевірив перші дві рівності. Третя рівність виявилася занадто стомлювальною, але я вірю, що вона дотримується.

Таким чином, ми маємо належний MGF. Якщо взяти розширення Тейлора 2-го порядку навколо нуля, ми маємо

M~(t)=M~(0)+M~(0)t+12M~(0)t2+o(t2)

M~(t)=1+12t2+o(t2)

Це означає, що характерна функція є (тутi позначає уявну одиницю)

ϕ~(t)=1+12(it)2+o(t2)=112t2+o(t2)
.

За властивостями характерної функції маємо, що характеристична функціяZ~/n дорівнює

ϕ~Z~/n(t)=ϕ~Z~(t/n)=1t22n+o(t2/n)

і оскільки у нас є незалежні випадкові величини, характерна функція 1ninZ~i є

ϕ~1ninZ~i(t)=i=1nϕ~Z~(t/n)=i=1n(1t22n+o(t2/n))

Тоді

limnϕ~1ninZ~i(t)=limn(1t22n)n=et2/2

за тим, як числоeпредставлена . Так трапляється, що останній член є характерною функцією стандартного нормального розподілу, і за теоремою про безперервність Леві ми маємо це

1ninZ~idN(0,1)

що є CLT. Зауважимо, що той факт, щоZ- змінні не є ідентично розподіленими, "зникли" з виду, коли ми розглянули їх центрировані та масштабовані версії та розглянули розширення Тейлора другого порядку їх MGF / CHF: на цьому рівні наближення ці функції однакові, і всі відмінності ущільнені в решті терміни, які зникають асимптотично.

Те, що ідіосинкратична поведінка на індивідуальному рівні, з усіх окремих елементів, все-таки зникає, коли ми розглядаємо середню поведінку, я вважаю, що це дуже добре показано з використанням бридкої істоти, як випадкова змінна, що має змішане поширення.


Дуже круто, Алеко. Я відчуваю, що аргумент повинен залежати від конкретніших умовaiі і bi's. Наприклад: чи порушується доказ, якщо(biai)0швидко? (Я знаю, що у вашій заяві цього не відбувається.) Як ви думаєте?
Дзен

@Zen Питання щодо дисперсій незалежних, але не ідентично розподілених rv є дуже тонким, я не думаю, що я все ще розумію це чітко. Відомі умови Ляпунова або Ліндеберга достатньо лише для проведення CLT. Бувають випадки, коли CLT виконується, хоча ці умови не виконують. Тож я думаю, що якщо ми не обмежимо дисперсії, то однозначної відповіді немає, і проблема стає цілком конкретною. Навіть книга Біллінгслі з цього питання не зрозуміла. Питання в тому, як буде виглядати залишок, і що ми можемо про це розповісти.
Алекос Пападопулос
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.