Скільки найбільших доданків удодати до половини всього?


11

Розглянемо де - , і CLT виконується. Скільки найбільших термінів складають половину загальної суми? Наприклад, 10 + 9 + 8 (10 + 9 + 8 + 1) / 2: 30% доданків досягають приблизно половини загальної суми.X 1 , , X Ni=1N|Xi|X1,,XN

Визначте
sumbiggest( j;X1XN)sum of the j biggest of |X1||XN|
halfsum(N)the smallest j such that sumbiggest( j )sumbiggest(N)/2.

Чи є загальний асимптотичний результат для півмісяця ( )? Просте, інтуїтивне виведення було б непоганим.N,μ,σ

(Трохи Монте-Карло припускає, що іноді напівсума ( ) / 4 або близько того, тобто найбільша 1/4 складає до 1/2 загальної кількості. Я отримую 0,24 за половину норми, 0,19 за експоненціальна, для = 20, 50, 100.)NN
Xi
NNN


3
Не чекайте універсального результату, схожого на CLT. Наприклад, відповідь для рівномірних (0,1) змінних буде сильно відрізнятися від відповіді для рівномірних (1000,1001) змінних!
whuber

Правильно, напівсума, звичайно, буде залежати від середнього та sd. Але чому ~ N / 5 для експоненціалу?
denis

2
Асимптотично, Денисе, відсіч для півсутки буде значенням для якого де - pdf для; питання задає ( - cdf для ). У випадку рівномірного розподілу ви отримуєте відповідь @ Діліпа; для експоненції, . х 0 т е ( т ) д т = 1 / 2 F | X i | N ( 1 - F ( x ) ) F | X i | [ 0 , 1 ] x 0,186682 N N / 5x0xtf(t)dt=1/2f|Xi|N(1F(x))F|Xi|[0,1]x0.186682NN/5
whuber

Відповіді:


2

Ні, загального асимптотичного результату немає. Нехай - упорядкований , де найбільший. x i x [ 1 ]x[1]x[N]xix[1]

Розглянемо наступні два приклади:

1) . Очевидно, що CLT має місце. Вам потрібно лише спостереження для. M = 1 M j = 1 | x [ j ] | 1P(x=0)=1M=1j=1M|x[j]|12N|xi|

2) . Очевидно, що CLT має місце. Вам потрібно спостережень для.M = N / 2 M j = 1 | x [ j ] | 1P(x=1)=1M=N/2j=1M|x[j]|12N|xi|

Для нетривіального прикладу розподіл Бернуллі:

3) . Знову CLT утримується. Вам потрібні спостережень, щоб відповідати вашим умовам. Змінюючи між 0 і 1, ви можете наблизитись до прикладу 1 або прикладу 2, як вам подобається.p N / 2 pP(x=1)=p, P(x=0)=1ppN/2p


4
Дійсно очевидно, що відповідь може бути десь між і , але це не означає відсутність загального результату. Що це означає, ми повинні розглядати відповіді, де частка залежить від деяких властивостей базового розподілу, таких як його середнє значення та SD. Цього достатньо, поряд з CLT, для надання конкретної та кількісної інформації про розподіл порівняно зі своєю сумою, тому доцільно сподіватися на такий результат. N / 2 x [ i ]0N/2x[i]
whuber

1

Ось грубий аргумент, що дає дещо іншу оцінку для рівномірно розподілених випадкових величин. Припустимо, що є безперервними випадковими змінними, рівномірно розподіленими на . Тоді має середнє значення . Припустимо, що за дивовижним і абсолютно неймовірним збігом обставин сума точно дорівнює . Отже, ми хочемо оцінити, скільки найбільших значень дорівнюють і більше. Тепер гістограма зразків ( дуже великих), отриманих з розподілу рівномірності є приблизно плоскою від до [ 0 , 1 ] i X i N / 2 N / 2 X N / 4 N N U [ 0 , 1 ] 0 1 x 0 < x < 1 ( 1 - x ) N x 1 ( 1 + x ) / 2 ( 1 - х ) N ( 1 +Xi[0,1]iXiN/2N/2XN/4NNU[0,1]01, і тому для будь-якого , , є зразків, розподілених приблизно рівномірно між до . Ці зразки мають середнє значення і суму, рівну . Сума перевищує для . Отже, сума найбільших вибірок перевищує .x0<x<1(1x)Nx1(1+x)/2N / 4 x 1 / (1x)N(1+x)/2)=(1x2)N/2N/4 (1-1/x1/2N/4(11/2)N0.3NN/4

Ви можете трохи спробувати і узагальнити це. Якщо , то для будь-якого заданого ми хочемо, щоб було таким, що де є нормальним із середнім та дисперсією . Таким чином, обумовлюється значенням , . Помножте на щільність та інтегруйте (від до ), щоб знайти середню кількість найбільших вибірок, що перевищить половину випадкової суми.Y x ( 1 - x 2 ) N / 2 = Y / 2 Y N / 2 N / 12 Y x = iХi=YYх(1-х2)N/2=Y/2YN/2N/12Y YY=0Y=Nх=1-(Y/N)YY=0Y=N


Відстань між двома точками, обмеженими на проміжку не може бути розподілено експоненціально, оскільки відстань має бути меншою за тоді як експоненціальна випадкова величина приймає значення у . Що правда , то , що якщо є незалежними експоненціальні випадкові величини, то умовні на , в порядкових статистик рівномірно розподілені в . Дивіться, наприклад, це питання та відповідь на супутниковому сайті math.SE. (продовження)1 ( 0 , ) Y 1 , Y 2 , , Y n + 1 Y max = α Y ( 1 ) , Y ( 2 ) , , Y ( n ) ( 0 , α )(0,1)1(0,)Y1,Y2,,Yн+1Yмакс=α Y(1),Y(2),,Y(н)(0,α)
Діліп Сарват

У будь-якому випадку мій аргумент не використовує відстані між упорядкованими зразками від рівномірного розподілу.
Діліп Сарват

Ти маєш рацію, я неправильно тебе зрозумів. Як бічне запитання, чи не є шматки між рівномірними випадковими точками експоненціально розподіленими після масштабування - зворотністю вашого q + a? [Правила зламаної палки з проекту демонстрації Вольфрама] ( demonstrations.wolfram.com/BrokenStickRule ) впевнені, що виглядає експоненціально, чи повинен бути простий? доказ.
denis

Будь-ласка, будь-ласка, поставте своє бокове запитання.
Діліп Сарват

Почавши, потім побачивши розподіл ймовірності розподілу довжини фрагмента , ви можете там прокоментувати.
denis

0

Припустимо, що X має просто позитивні значення для позбавлення від абсолютного значення.

Без точного доведення, я думаю, що вам доведеться вирішити для k

(1FX(k))E(X|X>=k)=12E(X) F - функція кумулятивного розподілу для X

і тоді відповідь дається, приймаючи найвищі значення.н(1-ЖХ(к))

Моя логіка полягає в тому, що асимптотично має бути сума всіх значень, вищих за k

н(1-ЖХ(к))Е(Х|Х> =к)

і асимптотично половина загальної суми становить приблизно

12нЕ(Х) .

Числове моделювання показує, що результат справедливий для рівномірного випадку (рівномірного в ), де і я отримую . Я не впевнений, чи завжди результат має місце, чи його можна далі спростити, але я думаю, що він дійсно залежить від функції розподілу F.F ( k ) = k k = [0,1]F(к)=кк=(12)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.