Чи має це дискретний розподіл назву?


21

Чи має це дискретний розподіл назву? Дляi1 ...N

f(i)=1Nj=iN1j

Я натрапив на цей розподіл із наступного: у мене є список з N елементів, ранжируваних за деякою функцією утиліти. Я хочу випадковим чином вибрати один із елементів, спрямовуючись на початок списку. Отже, я спочатку вибираю індекс j між 1 і N рівномірно. Потім я вибираю елемент між індексами 1 і j . Я вважаю, що цей процес призводить до вищезазначеного розподілу.


2
Це не розподіл: він не нормалізується.
whuber

@whuber Я подумав про це спочатку (і прокоментував це ще до того, як зрозумів, що я неправильно зрозумів та видалив коментар), але виявилося, що я неправильно зрозумів це визначення. Якщо у мене немає подальшого непорозуміння, це нормалізована функція масової ймовірності.
Glen_b -Встановіть Моніку

4
Це нормалізується. 1/1 з’явиться в сумі рівно один раз (це буде в f (1)). 1/2 з’явиться рівно двічі (це буде у f (1) та f (2)). і т.д. Отже, сума всіх цих сум буде N, а нормалізуюча константа відображається як 1 / N. перевіряє.
rcorty

1
Більше того, я не знаю, як називається цей дистрибутив. Я також не знаю, як описаний вами процес призводить до цього дистрогу. Я вважав, що це звучить як дискретна версія процесу розбиття палиць, яка дуже гугла.
rcorty

@Glen_b Дякую Я читав це на мій телефон, який не чинив f досить чітко.
whuber

Відповіді:


30

У вас є дискретизована версія розподілу негативного журналу, тобто дистрибутива, підтримка якого [0,1] і pdf якого f(т)=-журналт .

Щоб побачити це, я збираюся переосмислити вашу випадкову змінну для отримання значень у множині замість і викликати результуючий розподіл . Тоді, моя вимога така{ 0 , 1 , 2 , , N } T{0,1/N,2/N,,1}{0,1,2,,N}Т

Пr(Т=тN)-1Nжурнал(тN)

як тоді як утримується (приблизно) постійною. N,ттN

По-перше, невеликий імітаційний експеримент, що демонструє цю конвергенцію. Ось невелика реалізація вибірки з вашого розповсюдження:

t_sample <- function(N, size) {
  bounds <- sample(1:N, size=size, replace=TRUE)
  samples <- sapply(bounds, function(t) {sample(1:t, size=1)})
  samples / N
}

Ось гістограма великого зразка, взятого з вашого розповсюдження:

ss <- t_sample(100, 200000)
hist(ss, freq=FALSE, breaks=50)

введіть тут опис зображення

і ось логарифмічний PDF-файл накладений:

linsp <- 1:100 / 100
lines(linsp, -log(linsp))

введіть тут опис зображення

Щоб зрозуміти, чому виникає така конвергенція, почніть з свого вираження

Пr(Т=тN)=1Nj=тN1j

і помножити і ділити наN

Пr(Т=тN)=1Nj=тNNj1N

Підсумовування тепер є ріманською сумою для функції , інтегрованої від до . Тобто для великих ,г(х)=1хтN1N

Пr(Т=тN)1NтN11хгх=-1Nжурнал(тN)

яке вираження я хотів досягти.


Ви надзвичайно раді. Це було чудове питання, і мені було дуже цікаво опрацювати це.
Метью Друрі

6

Це, мабуть, пов'язане з розповсюдженням Вітворта. (Я не вірю, що це розподіл Вітворта, оскільки, якщо я пам'ятаю правильно, це розподіл набору впорядкованих значень, але, здається, це пов'язано з ним і спирається на ту саму схему підсумовування.)

Існує деяка дискусія про Вітворт (та численні посилання) у

Ентоні Лоуренс та Роберт Маркс (2008)
"Розподіл фірм за розміром у галузі з обмеженими ресурсами", "
Прикладна економіка" , т. 40, випуск 12, сторінки 1595-1607

(Здається, тут є версія робочого паперу )

Також див

Ненсі Л Геллер, (1979)
Тест на значення для розповсюдження Вітворта,
Журнал Американського товариства інформатики , т. 30 (4), с.229-231


2
Щоб зробити цю відповідь самодостатньою, ви могли б дати визначення розповсюдження Вітворта і, можливо, надати кілька слів пояснень стосовно зв’язку, який ви бачите?
whuber

@whuber Так, це має бути коментар, як він є. Я відредагую деякі деталі, але це закінчиться набагато довше.
Glen_b -Встановіть Моніку

Просто якесь визначення було б добре.
whuber

Дякую, це було зрозуміло, але все-таки такий буде результат.
Glen_b -Встановити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.