Поширення найбільшого фрагмента зламаної палички (проміжки)


21

Нехай палиця довжиною 1 розбивається на фрагменти навмання рівномірно. Який розподіл довжини найдовшого фрагмента?k+1

Більш формально, нехай буде IID , і нехай є пов'язаною статистикою замовлення, тобто ми просто замовляємо зразок таким чином, що . Нехай .(U1,Uk)U(0,1)(U(1),,U(k))U(1)U(2),,U(k)Zk=max(U(1),U(2)U(1),,U(k)U(k1),1U(k))

Мене цікавить розподіл Zk . Моменти також є асимптотичними результатами або наближеннями k .


9
Це добре вивчена проблема; див. R. Pyke (1965), "Spacings", JRSS (B) 27 : 3, pp. 395-449. Я спробую повернутися, щоб додати трохи інформації пізніше, якщо хтось не поб'є мене. Існує також документ 1972 року того ж автора (" Spacings revisited "), але я думаю, що ви шукаєте, це майже все спочатку. У Devroye (1981) є деякі асимптотики , "Закони ітераційного логарифму для статистики замовлень рівномірних розмірів" Енн. Імовірно. , 9 : 5, 860-867.
Glen_b -Встановити Моніку

4
Вони також повинні дати кілька хороших пошукових термінів, щоб знайти пізніше роботу, якщо вона вам потрібна.
Glen_b -Встановіть Моніку

3
Це круто. Першу довідку важко знайти. Для зацікавлених я поклав це на The Grand Locus .
gui11aume

Виправте помилку: Y(к) замість U(к) .
Віктор

Дякую @Viktor! Щодо таких дрібниць, не соромтеся самостійно редагувати (я думаю, що вони будуть переглянуті іншими користувачами для затвердження).
gui11aume

Відповіді:


18

З інформацією, наданою @Glen_b, я міг знайти відповідь. Використовуючи ті самі позначення, що і питання

P(Zkx)=j=0k+1(k+1j)(1)j(1jx)+k,

де якщо і іншому випадку. Я також даю очікування та асимптотичну конвергенцію до розподілу Гумбеля ( NB : не бета)a+=a0a>00

E(Zk)=1k+1i=1k+11ilog(k+1)k+1,P(Zkx)exp(e(k+1)x+log(k+1)).

Матеріал доказів взято з кількох публікацій, пов'язаних у посиланнях. Вони дещо довгі, але прямолінійні.

1. Доведення точного розподілу

Нехай - IID однакові випадкові величини в інтервалі . Замовляючи їх, ми отримуємо статистику порядок позначених . Рівномірні проміжки визначаються як , з і . Впорядковані інтервали - відповідна упорядкована статистика . Змінна інтерес становить .( 0 , 1 ) k ( U ( 1 ) , , U ( k ) ) Δ i = U ( i ) - U ( i - 1 ) U ( 0 ) = 0 U ( k + 1 ) = 1 Δ ( 1 )(U1,,Uk)(0,1)k(U(1),,U(k))Δi=U(i)U(i1)U(0)=0U(k+1)=1 Δ ( k + 1 )Δ(1)Δ(k+1)Δ(k+1)

Для фіксованого визначаємо індикаторну змінну . За симетрією випадковий вектор є обмінним, тому спільний розподіл підмножини розміру такий же, як спільний розподіл перший . Розширюючи продукт, ми отримуємо таким чином1 i = 1 { Δ i > x } ( 1 1 , , 1 k + 1 ) j jx(0,1)1i=1{Δi>x}(11,,1к+1)jj

П(Δ(к+1)х)=Е(i=1к+1(1-1i))=1+j=1к+1(к+1j)(-1)jЕ(i=1j1i).

Тепер ми доведемо, що , що встановить розподіл, поданий вище. Доводимо це для , оскільки загальний випадок доводиться аналогічно.Е(i=1j1i)=(1-jх)+кj=2

Е(i=121i)=П(Δ1>хΔ2>х)=П(Δ1>х)П(Δ2>х|Δ1>х).

Якщо , точки знаходяться в інтервалі . Умовно в цій події точки перерви все ще є обмінними, тому ймовірність того, що відстань між другою і першою точкою розриву перевищує є такою ж, як імовірність того, що відстань між першою точкою зламу та лівим бар'єром (у положенні ) більший за . Такk ( x , 1 ) xΔ1>хк(х,1)хxхх

П(Δ2>х|Δ1>х)=П(всі пункти в (2х,1)|всі пункти в (х,1)),такП(Δ2>хΔ1>х)=П(всі пункти в (2х,1))=(1-2х)+к.

2. Очікування

Для дистрибутивів з обмеженою підтримкою ми маємо

Е(Х)=П(Х>х)гх=1-П(Хх)гх.

Інтегруючи розподіл , отримаємоΔ(к+1)

Е(Δ(к+1))=1к+1j=1к+1(к+1j)(-1)j+1j=1к+1j=1к+11j.

Остання рівність - це класичне зображення гармонічних чисел , які ми демонструємо нижче.Hi=1+12++1i

Hk+1=011+x++xkdx=011xk+11xdx.

Зі зміною змінної та розширенням добутку отримуємоu=1x

Hk+1=01j=1k+1(k+1j)(1)j+1uj1du=j=1k+1(k+1j)(1)j+1j.

3. Альтернативна побудова рівномірних міжряддя

Для отримання асимптотичного розподілу найбільшого фрагмента нам потрібно буде демонструвати класичну побудову рівномірних проміжків як експоненціальних змінних, поділених на їх суму. Щільність ймовірності статистики пов'язаного замовлення становить(U(1),,U(k))

fU(1),U(k)(u(1),,u(k))=k!,0u(1)u(k+1).

Якщо позначимо рівномірні проміжки , з , отримаємо U ( 0Δi=U(i)U(i1)U(0)=0

fΔ1,Δk(δ1,,δk)=k!,0δi++δk1.

Визначивши , отримаємо таким чиномU(k+1)=1

fΔ1,Δk+1(δ1,,δk+1)=k!,δ1++δk=1.

Тепер нехай - експоненціальні випадкові змінні IID із середнім значенням 1, і нехай . За допомогою простої зміни змінної ми можемо це побачити(X1,,Xk+1)S=X1++Xk+1

fX1,Xk,S(x1,,xk,s)=es.

Визначимо , таким чином, що при зміні змінної ми отримаємоYi=Xi/S

fY1,Yk,S(y1,,yk,s)=skes.

Інтегруючи цю щільність відносно , ми отримуємо таким чиномs

fY1,Yk,(y1,,yk)=0skesds=k!,0yi++yk1,and thusfY1,Yk+1,(y1,,yk+1)=k!,y1++yk+1=1.

Отже спільний розподіл рівномірних проміжків на інтервалі такий же, як спільний розподіл експоненціальних випадкових величин, поділених на їх суму. Ми приходимо до наступної еквівалентності розподілуk+1(0,1)k+1

Δ(k+1)X(k+1)X1++Xk+1.

4. Асимптотичний розподіл

Використовуючи вищезгадану еквівалентність, отримуємо

P((k+1)Δ(k+1)log(k+1)x)=P(X(k+1)(x+log(k+1))X1++Xk+1k+1)=P(X(k+1)log(k+1)x+(x+log(k+1))Tk+1),

де . Ця змінна втрачає ймовірність, оскільки і . Асимптотично розподіл такий самий, як у . Оскільки - IID, у нас єTk+1=X1++Xk+1k+11E(Tk+1)=0Vаr(журнал(к+1)Тк+1)=(журнал(к+1))2к+10Х(к+1)-журнал(к+1)Хi

П(Х(к+1)-журнал(к+1)х)=П(Х1х+журнал(к+1))к+1=(1-е-х-журнал(к+1))к+1=(1-е-хк+1)к+1досвід{-е-х}.

5. Графічний огляд

На графіку нижче показано розподіл найбільшого фрагмента для різних значень . Для я також наклав асимптотичний розподіл Гамбеля (тонка лінія). Gumbel дуже поганий наближення для малих значень тому я опускаю їх, щоб не перевантажувати картинку. Наближення Гумбеля добре від .кк=10,20,50кк50

Поширення найбільшого фрагмента зламаної палички

6. Список літератури

Наведені вище докази взяті з посилань 2 і 3. Цитується література містить набагато більше результатів, таких як розподіл упорядкованих проміжків будь-якого рангу, їх граничний розподіл та деякі альтернативні побудови упорядкованих рівномірних інтервалів. Ключові посилання легко доступні, тому я також надаю посилання на повний текст.

  1. Байрамов та ін. (2010) Обмеження результатів для упорядкованих рівномірних проміжків , Стат. Документи, 51: 1, с. 227-240
  2. Холст (1980) Про довжину шматочків палиці, розбитої навмання , Дж. Еппл. Проб., 17, с. 623-634
  3. Pyke (1965) Spacings , JRSS (B) 27: 3, pp. 395-449
  4. Renyi (1953) Про теорію статистики порядку , Acta math Hung, 4, pp. 191-231

Блискуча. До речі, чи є асимптотика ? Е(Zк2)
Амір Сагів

@AmirSagiv це хороше питання. Я швидко переглянув посилання і не зміг його знайти. Я також не міг адаптувати доказ вище. Це дало мені зрозуміти, що я не знаю, що таке розподіл квадрата Гамбеля. Можливо, гарне місце для початку?
gui11aume

1
$ gui11aume Подивіться тут: mathoverflow.net/a/293381/42864
Амір

1
@AmirSagiv Це дуже хороший пост. Чомусь я неправильно зрозумів ваше запитання і подумав, що ви зацікавлені в асимптотичному розподілі (навіть якщо ваш коментар був дуже чітким), тому мій коментар вище не так актуальний. Zк2
gui11aume

3

Це не повна відповідь, але я зробив кілька швидких симуляцій, і ось що я отримав: Гістограма найдовшого фрагмента

Це виглядає надзвичайно бета-ish, і це має певний сенс, оскільки статистика замовлень однакового розподілу - це бета- вікі .

Це може дати певну вихідну точку для отримання отриманого PDF-файлу.

Я оновлю, якщо дістану остаточне закрите рішення.

Ура!


Ще одне - форма гістограми для збільшення k не помітно змінюється, окрім того, що «скуті» наближаються до 0.
Ліма,

1
Дякуємо за ваші думки @Lima (і ласкаво просимо до Cross Validated). Я думаю, що вашу відповідь можна покращити. По-перше, я б утримався від заяв без доказів. Якщо це неправильно, ви можете поставити людей, які бачать цю тему, неправильно. По-друге, я б задокументував те, що ви зробили. Без значення яке ви використовували, ні коду, цифра нікому не допомагає. Нарешті, я скопіював-відредагував би відповідь та видалив усе, що не відповідає безпосередньо на питання. к
gui11aume

1
Дякуємо за пропозиції. Вони дійсні поза обміном стеками, і я не забуду їх використовувати.
Ліма

1

Я відповів на конференцію в Сієні (Італія) у 2005 році. Доклад (2006) представлений на моєму веб-сайті тут (pdf) . Точні розподіли всіх інтервалів (найменший до найбільших) можна знайти на сторінках 75 та 76.

Я сподіваюся виступити з доповіддю на цю тему на конференції RSS у Манчестері (Англія) у вересні 2016 року.


2
Ласкаво просимо на сайт. Ми намагаємось створити постійний сховище високоякісної статистичної інформації у вигляді запитань та відповідей. Таким чином, ми насторожено ставимося до відповідей, що стосуються лише посилання, завдяки linkrot. Чи можете ви опублікувати повне цитування та резюме інформації за посиланням, якщо вона загине? Також, будь ласка, не підписуйте тут свої повідомлення. Кожна публікація містить посилання на вашу сторінку користувача, де ви можете розмістити цю інформацію.
gung - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.