Статистика замовлень (наприклад, мінімум) нескінченної колекції чи-квадратних змінних?


11

Тут у мене вперше, тому, будь ласка, повідомте мене, чи можу я прояснити своє питання будь-яким способом (у тому числі форматування, теги тощо). (І, сподіваюся, я можу відредагувати пізніше!) Я намагався знайти посилання та намагався вирішити себе за допомогою індукції, але не вдалося в обох.

Я намагаюся спростити розподіл, який, здається, зводиться до статистики порядку незмінно нескінченного набору незалежних випадкових змінних з різним ступенем свободи; конкретно, який розподіл найменшого значення серед незалежних ?χ2mχ22,χ42,χ62,χ82,

Мене зацікавив би особливий випадок : який розподіл мінімуму (незалежного) ?m=1χ22,χ42,χ62,

У випадку мінімуму я зміг записати функцію кумулятивного розподілу (CDF) як нескінченний продукт, але не можу далі спростити його. Я використовував той факт , що ВПР з є (З , це підтверджує другий коментар нижче про еквівалентність з експоненціальним розподілом з очікуванням 2.) CDF мінімуму може бути записаний як Перший член у творі - це просто , а "останній" термін -χ2m2

F2m(x)=γ(m,x/2)/Γ(m)=γ(m,x/2)/(m1)!=1ex/2k=0m1xk/(2kk!).
m=1
Fmin(x)=1(1F2(x))(1F4(x))=1m=1(1F2m(x))
e-x/2e-x/2 k = 0 xk/(2kk!)=1
=1m=1(ex/2k=0m1xk2kk!).
ex/2ex/2k=0xk/(2kk!)=1 . Але я не знаю, як (якщо можливо?) Спростити це звідти. А може, зовсім інший підхід є кращим.

Ще одне потенційно корисне нагадування: - це те саме, що експоненціальний розподіл із очікуванням 2, а - сума двох таких експоненцій тощо. χ 2 4χ22χ42

Якщо комусь цікаво, я намагаюся спростити теорему 1 у цій статті для випадку регресії на постійній ( для всіх ). (У мене замість розподілів, оскільки я помножив на .)i χ 2 Γ 2 κxi=1iχ2Γ2κ


Чи відповідає це на ваше запитання?
mpiktas

@mpiktas: дякую за пропозицію. Це схоже, за винятком експонентів з різними параметрами швидкості, у мене є ква-квадрати з різним ступенем свободи (і нескінченна їх кількість, не кінцева). І хоча є експоненціальною, не є; вони є сумами експоненціалів, але суми експоненціалів самі по собі не є експоненціальними. (І в ідеалі я сподіваюсь на загальну статистику замовлень, хоча мін буде чудовим початком.) χ 2 4 , χ 2 6 , χ22χ42,χ62,
Девід М Каплан

1
Я сумніваюся, що для цього є закрита форма. Однак він має цікаву характеристику: коли є iid змінними Пуассона ( ), , то - це шанс, що всі . λ / 2 k = 1 , 2 , 1 - F m i n ( λ ) X kkXkλ/2k=1,2,1Fmin(λ)Xkk
whuber

1
@whuber: Це, мабуть, не так вже й цікаво, якщо подумати про процес Пуассона, що є формулюванням, з яким я грав. Нехай буде iid випадковими змінними, з відповідним процесом Пуассона ставки . Нехай , , та ін. Тоді є незалежними і стаціонарними властивостями незалежних приростів процесу Пуассона ми мати, що . T1,T2,Exp(1/2)N(t):=sup{n:i=1nTit}1/2U1=T1U2=T2+T3U iχ 2 2 i P ( U it ) = P ( N ( t ) i )U3=T4+T5+T6Uiχ2i2P(Uit)=P(N(t)i)
кардинал

@Cardinal Звичайно: це хороший спосіб побачити це. Цікавість полягає не у відносинах між Пуассоном та Гаммами; вона полягає в описі самої події!
whuber

Відповіді:


8

Нулі нескінченного добутку будуть об'єднанням нулів доданків. Обчислення на 20-му терміні показує загальну закономірність:

сюжет складних нулів

Цей сюжет нулів у складній площині відрізняє внески окремих доданків у творі за допомогою різних символів: на кожному кроці видимі криві розширюються далі, а нова крива починається ще далі.

Складність цієї картини демонструє, що не існує рішення закритої форми з точки зору добре відомих функцій вищого аналізу (таких як гамма, тетас, гіпергеометричні функції тощо), а також елементарних функцій, як описується в класичному тексті, як Уіттакер & Ватсон ).

Таким чином, проблема може бути більш плідно поставлена ​​дещо інакше : що потрібно знати про розподіл статистики замовлень? Оцінки їх характерних функцій? Моменти низького замовлення? Наближення до квантилів? Щось ще?


Чому нулі товару мають важливе значення? Я відчуваю, що пропускаю щось банальне.
mpiktas

2
@mp Нулі та полюси показують щось про складність функції. Раціональні функції мають їх кінцеву кількість. Елементарні функції зазвичай мають рядок нулів, наприклад, на , інтеграл, для ; типові "трансцендентальні" функції мають трохи більш складні структури нулів, такі як взагалі непозитивні цілі числа (зворотна функція Гамма) або на решітці точок (тета-функції та еліптичні функції). Тут представлена ​​складна картина говорить про те, що виразити CDF в рамках цих звичних функцій буде важко або неможливо. 2iπnnexp()
whuber

2
@whuber (1/2), дякую! Я не знав про різні класи функцій, що мають ті різні закономірності нулів у складній площині; це здається дуже корисним, і ваш графік, здається, відповідає на моє запитання (як поставлено).
David M Kaplan

@whuber (2/2), це перевіряло особливий випадок (складного) розподілу оцінювача, поданого в іншій роботі. Вони використали існування дистрибутива для обгрунтування використання завантажувальної програми; мій радник запропонував спробувати наблизити розподіл. Здається, їх розподіл може бути вимкнено для цього особливого випадку (де я знаю, що це повинно бути), тому я перевірю свого радника після закінчення терміну його надання; але, можливо, я б намагався прийняти розширення вищого порядку го порядку впорядкованості (поділене на ) як , у більш складній обстановці. Опублікує знову, якщо так; знову дякую! mmm
Девід М Каплан

4

який розподіл мінімуму (незалежного) ?χ22,χ42,χ62,

Вибачте за приїзд на 6 років. Незважаючи на те, що ОП, ймовірно, зараз перейшла до інших проблем, питання залишається свіжим, і я думав, що я міг би запропонувати інший підхід.


Нам подано де де з у форматі pdf :(X1,X2,X3,)XiChisquared(vi)vi=2ifi(xi)

введіть тут опис зображення

Ось графік відповідного файлу у форматі pdf , коли розмір вибірки збільшується, для :fi(xi)i=1 to 8

введіть тут опис зображення

Нас цікавить розподіл .min(X1,X2,X3,)

Щоразу, коли ми додаємо додатковий термін, доданий pdf граничний останній термін зміщується все далі і далі вправо, так що ефект додавання все більше і більше термінів стає не тільки менш і менш актуальним, але і після лише декількох термінів , стає майже незначним - за мінімальним зразком. Це означає, що насправді має значення лише дуже невелика кількість термінів ... а додавання додаткових термінів (або наявність нескінченної кількості термінів) в значній мірі не має значення для мінімальної проблеми вибірки.

Тест

Щоб перевірити це, я обчислив pdf до 1 терміна, 2 терміна, 3 терміна, 4 терміна, 5 термінів, 6 термінів, 7 термінів, 8 термінів, до 9 термінів і до 10 термінів. Для цього я використав функцію від mathStatica , доручивши її тут обчислити pdf зразка мінімуму ( порядка статистики порядку) у вибірці розміру , а де параметр (замість цього виправлено) - це :1- й j i v imin(X1,X2,X3,)OrderStatNonIdentical1stjivi

введіть тут опис зображення введіть тут опис зображення

Це стає дещо складніше, оскільки кількість термінів збільшується ... але я показав вихід на 1 термін (1-й рядок), 2 терміни (другий ряд), 3 терміни (3-й ряд) і 4 терміни вище.

На наступній схемі порівнюється pdf зразка мінімуму з 1 терміном (синій), 2 членами (помаранчевий), 3 термінами та 10 термінами (червоний). Зауважте, наскільки схожі результати лише з 3-ма термінами проти 10-ти термінів: введіть тут опис зображення

На наступній схемі порівнюються 5 термінів (синій) та 10 термінів (помаранчевий) - сюжети настільки схожі, що вони знищують один одного, і різниці навіть не видно:

введіть тут опис зображення

Іншими словами, збільшення кількості термінів з 5 до 10 майже не відчутно візуально впливає на розподіл вибіркового мінімуму.

Напівлогістичне наближення

Нарешті, відмінним простим наближенням pdf зразка min є напівлогічний розподіл з pdf:

g(x)=2ex(ex+1)2 for x>0

На наступній схемі порівнюється точне рішення з 10 членами (яке не можна відрізнити від 5 доданків або 20 доданків) і напівлогістичним наближенням (пунктирним):

введіть тут опис зображення

Збільшення до 20 термінів не робить помітної різниці.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.