Максимальний зазор між зразками, взятими без заміни, з дискретного рівномірного розподілу


16

Ця проблема пов'язана з дослідженнями моєї лабораторії з роботизованого покриття:

Довільно намалюйте чисел із безлічі без заміни та сортуйте числа у порядку зростання. .n{1,2,,m}1nm

З цього відсортованого списку чисел генерують різницю між послідовними числами та межами: . Це дає прогалини.{a(1),a(2),,a(n)}g={a(1),a(2)a(1),,a(n)a(n1),m+1a(n)}n+1

Який розподіл максимального проміжку?

P(max(g)=k)=P(k;m,n)=?

Це можна поставити за допомогою статистики замовлень : P(g(n+1)=k)=P(k;m,n)=?

Див посилання на розподіл прогалин , але це питання задає розподіл максимального розриву.

Я буду задоволений середнім значенням, E[g(n+1)] .

Якщо n=m всі прогалини мають розмір 1. Якщо n+1=m є один проміжок розміром 2 , а n+1 можливі місця. Максимальний розмір зазору - mn+1 , і цей проміжок може бути розміщений до або після будь-якого з n чисел, для загальної кількості n+1 можливих позицій. Найменший максимальний розмір зазору - mnn+1 . Визначте ймовірність будь-якої заданої комбінації T=(mn)1 .

Я частково вирішив функцію маси ймовірностей як (1)P(g(n+1)=k)=P(k;m,n)={0k<mnn+11k=mnn+11k=1 (occurs when m=n)T(n+1)k=2 (occurs when m=n+1)T(n+1)k=m(n1)n?m(n1)nkmn+1T(n+1)k=mn+10k>mn+1

Поточна робота (1): Рівняння для першого проміжку є прямим: Очікуване значення має просте значення: . За симетрією я очікую, що всі прогалини матимуть це розподіл. Можливо, рішення можна було знайти, витягуючи з цього розподілу разів.a(1)E[P(a(1))]=1

P(a(1)=k)=P(k;m,n)=1(mn)k=1mn+1(mk1n1)
nnE[P(a(1))]=1(mn)k=1mn+1(mk1n1)k=mn1+nnn

Поточна робота (2): легко запускати моделювання Монте-Карло.

simMaxGap[m_, n_] := Max[Differences[Sort[Join[RandomSample[Range[m], n], {0, m+1}]]]];
m = 1000; n = 1; trials = 100000;
SmoothHistogram[Table[simMaxGap[m, n], {trials}], Filling -> Axis,
Frame -> {True, True, False, False},
FrameLabel -> {"k (Max gap)", "Probability"},
PlotLabel -> StringForm["m=``,n=``,smooth histogram of maximum map for `` trials", m, n, trials]][![enter image description here][1]][1]

1
З цими умовами ви повинні мати n <= m. Я думаю, ви хочете g = {a_ (1), a_ (2) -a_ (1), ..., a_ (n) -a_ (n-1)}. Чи підбирає випадковим чином середній вибір кожного числа з ймовірністю 1 / м на першому жеребкуванні? Оскільки ви не замінюєте, ймовірність буде 1 / (m-1) на другій і так далі до 1 на mth витягуванні, якщо n = m. Якщо n <m, це зупиниться раніше, коли останній нічия має ймовірність 1 / (m- (n-1)) на n-му розіграші.
Майкл Р. Черник

2
Ваш оригінальний опис не мав сенсу, оскільки (я вважаю) ви перевели два підписки. Будь ласка , переконайтеся , що моє редагування відповідає вашому наміру: зокрема, будь ласка , підтвердіть , що ви маєте в виду там бути прогалин, з яких є першою. gna(1)
whuber

1
@gung Я думаю, що це дослідження, а не самодослідження
Glen_b -Встановити Моніку

1
Я думаю, що ваш мінімальний і максимальний розміри зазорів повинні бути і . Мінімальний розмір зазору - це коли обираються послідовні цілі числа, а максимальний розмір проміжку виникає, коли ви вибираєте і перші цілі числа (або і )1mn+1mn11,,n11mn+2,,m
Ймовірністьлогічний

1
Дякуємо, Майкл Черник та ймовірність, що ви внесені корективи. Дякую @whuber за внесення виправлень!
AaronBecker

Відповіді:


9

Нехай є шансом, що мінімум, , дорівнює ; тобто вибірка складається з і -підмножини . Є такі підмножини з однаково вірогідних підмножин, звідкиf(g;n,m)a(1)ggn1{g+1,g+2,,m}(mgn1)(mn)

Pr(a(1)=g=f(g;n,m)=(mgn1)(mn).

Додавання для всіх можливих значень більших ніж дає функцію виживанняf(k;n,m)kg

Pr(a(1)>g)=Q(g;n,m)=(mg)(mg1n1)n(mn).

Нехай - випадкова величина, задана найбільшим проміжком:Gn,m

Gn,m=max(a(1),a(2)a(1),,a(n)a(n1)).

(Це відповідає на запитання як оригінально оформлене, перш ніж його змінити, щоб включити проміжок між і .)a(n)m Ми обчислимо його функцію виживання з якого легко виводиться весь розподіл . Метод - це динамічна програма, що починається з , для якої очевидно, що

P(g;n,m)=Pr(Gn,m>g),
Gn,mn=1

(1)P(g;1,m)=Pr(G1,m>1)=mgm, g=0,1,,m.

Для більшого зауважте, що подія - це неперервне об'єднання подіїn>1Gn,m>g

a1>g,

для яких найперший проміжок перевищує , а окремі подіїgg

a1=k and Gn1,mk>g, k=1,2,,g

для якого перший проміжок дорівнює а зазор, більший за виникає пізніше у вибірці. Закон сумарної ймовірності стверджує, що ймовірності цих подій додаються, звідсиkg

(2)P(g;n,m)=Q(g;n,m)+k=1gf(k;n,m)P(g;n1,mk).

Закріпивши і виклавши двосторонній масив, індексований і , ми можемо обчислити , використовуючи заповнити перший рядок і заповнити кожен наступний рядок, використовуючи операції на рядок. Отже, таблицю можна заповнити операціями і всі таблиці для через можуть бути побудовані в операціях .gi=1,2,,nj=1,2,,mP(g;n,m)(1)(2)O(gm)O(gmn)g=1g=mn+1O(m3n)

Малюнок

Ці графіки показують функцію виживання при . Зі збільшенням граф рухається вліво, що відповідає зменшенню шансів великих прогалин.gP(g;n,64)n=1,2,4,8,16,32,64n

Закриті формули для можна отримати у багатьох спеціальних випадках, особливо для великих , але мені не вдалося отримати закриту формулу, що стосується всіх . Гарні наближення легко доступні, замінивши цю проблему аналогічною задачею на безперервні однорідні змінні.P(g;n,m)ng,n,m

Нарешті, очікування отримується шляхом підсумовування його функції виживання, починаючи з :Gn,mg=0

E(Gn,m)=g=0mn+1P(g;n,m).

Малюнок 2: контурний графік очікування

Цей контурний графік очікування показує контури в , закінчуючи темне до світлого.2,4,6,,32


Пропозиція: рядок "Нехай - випадкова величина, задана найбільшим проміжком:", будь ласка, додайте останній проміжок . Сюжет вашого очікування відповідає моєму моделюванню в Монте-Карло. Gn,mm+1an
AaronBecker
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.