Максимальний зазор між зразками, взятими без заміни, з дискретного рівномірного розподілу

Ця проблема пов'язана з дослідженнями моєї лабораторії з роботизованого покриття:

Довільно намалюйте чисел із безлічі без заміни та сортуйте числа у порядку зростання. . $n$ $\{1,2,\ldots,m\}$ $1\le n\le m$

З цього відсортованого списку чисел генерують різницю між послідовними числами та межами: . Це дає прогалини. $\{a_{(1)},a_{(2)},…,a_{(n)}\}$ $g = \{a_{(1)},a_{(2)}−a_{(1)},\ldots,a_{(n)}−a_{(n-1)},m+1-a_{(n)}\}$ $n+1$

Який розподіл максимального проміжку?

$P(\max(g) = k) = P(k;m,n) = ?$

Це можна поставити за допомогою статистики замовлень : $P(g_{(n+1)} = k) = P(k;m,n) = ?$

Див посилання на розподіл прогалин , але це питання задає розподіл максимального розриву.

Я буду задоволений середнім значенням, $\mathbb{E}[g_{(n+1)}]$ .

Якщо $n=m$ всі прогалини мають розмір 1. Якщо $n+1 = m$ є один проміжок розміром $2$ , а $n+1$ можливі місця. Максимальний розмір зазору - $m-n+1$ , і цей проміжок може бути розміщений до або після будь-якого з $n$ чисел, для загальної кількості $n+1$ можливих позицій. Найменший максимальний розмір зазору - $\lceil\frac{m-n}{n+1}\rceil$ . Визначте ймовірність будь-якої заданої комбінації $T= {m \choose n}^{-1}$ .

Я частково вирішив функцію маси ймовірностей як $P(g_{(n+1)} = k) = P(k;m,n) = \begin{cases} 0 & k < \lceil\frac{m-n}{n+1}\rceil\\ 1 & k = \frac{m-n}{n+1} \\ 1 & k = 1 \text{ (occurs when $m=n$)} \\ T(n+1)& k = 2 \text{ (occurs when $m=n+1$)} \\ T(n+1)& k = \frac{m-(n-1)}{n} \\ ? & \frac{m-(n-1)}{n} \le k \le m-n+1 \\ T(n+1)& k = m-n+1\\ 0 & k > m-n+1 \end{cases} \tag{1}$

Поточна робота (1): Рівняння для першого проміжку є прямим: Очікуване значення має просте значення: . За симетрією я очікую, що всі прогалини матимуть це розподіл. Можливо, рішення можна було знайти, витягуючи з цього розподілу разів. $a_{(1)}$

P (a_{(1)} = k) = P (k; m, n) = \frac{1}{(\binom{m}{n})} \sum_{k = 1}^{m - n + 1} (\binom{m - k - 1}{n - 1})

$P(a_{(1)} = k) = P(k;m,n) = \frac{1}{{m \choose n}} \sum_{k=1}^{m-n+1} {m-k-1 \choose n-1}$

E [P (a_{(1)})] = \frac{1}{(\binom{m}{n})} \sum_{k = 1}^{m - n + 1} (\binom{m - k - 1}{n - 1}) k = \frac{m - n}{1 + n}

$\mathbb{E}[P(a_{(1)})] = \frac{1}{ {m \choose n}} \sum_{k=1}^{m-n+1} {m-k-1 \choose n-1} k = \frac{m-n}{1+n}$

n

$n$

n

$n$

Поточна робота (2): легко запускати моделювання Монте-Карло.

simMaxGap[m_, n_] := Max[Differences[Sort[Join[RandomSample[Range[m], n], {0, m+1}]]]];
m = 1000; n = 1; trials = 100000;
SmoothHistogram[Table[simMaxGap[m, n], {trials}], Filling -> Axis,
Frame -> {True, True, False, False},
FrameLabel -> {"k (Max gap)", "Probability"},
PlotLabel -> StringForm["m=``,n=``,smooth histogram of maximum map for `` trials", m, n, trials]][![enter image description here][1]][1]

— AaronBecker
джерело

З цими умовами ви повинні мати n <= m. Я думаю, ви хочете g = {a_ (1), a_ (2) -a_ (1), ..., a_ (n) -a_ (n-1)}. Чи підбирає випадковим чином середній вибір кожного числа з ймовірністю 1 / м на першому жеребкуванні? Оскільки ви не замінюєте, ймовірність буде 1 / (m-1) на другій і так далі до 1 на mth витягуванні, якщо n = m. Якщо n <m, це зупиниться раніше, коли останній нічия має ймовірність 1 / (m- (n-1)) на n-му розіграші.

— Майкл Р. Черник

Ваш оригінальний опис не мав сенсу, оскільки (я вважаю) ви перевели два підписки. Будь ласка , переконайтеся , що моє редагування відповідає вашому наміру: зокрема, будь ласка , підтвердіть , що ви маєте в виду там бути прогалин, з яких є першою.

g

$g$

n

$n$

a_{(1)}

$a_{(1)}$

— whuber

@gung Я думаю, що це дослідження, а не самодослідження

— Glen_b -Встановити Моніку

Я думаю, що ваш мінімальний і максимальний розміри зазорів повинні бути і . Мінімальний розмір зазору - це коли обираються послідовні цілі числа, а максимальний розмір проміжку виникає, коли ви вибираєте і перші цілі числа (або і )

1

$1$

m - n + 1

$m-n+1$

m

$m$

n - 1

$n-1$

1, \dots, n - 1

$1,\dots,n-1$

1

$1$

m - n + 2, \dots, m

$m-n+2,\dots,m$

— Ймовірністьлогічний

Дякуємо, Майкл Черник та ймовірність, що ви внесені корективи. Дякую @whuber за внесення виправлень!

— AaronBecker

Нехай є шансом, що мінімум, , дорівнює ; тобто вибірка складається з і -підмножини . Є такі підмножини з однаково вірогідних підмножин, звідки $f(g;n,m)$ $a_{(1)}$ $g$ $g$ $n-1$ $\{g+1,g+2,\ldots,m\}$ $\binom{m-g}{n-1}$ $\binom{m}{n}$

Pr (a_{(1)} = g = f (g; n, m) = \frac{(\binom{m - g}{n - 1})}{(\binom{m}{n})} .

$\Pr(a_{(1)}=g = f(g;n,m) = \frac{\binom{m-g}{n-1}}{\binom{m}{n}}.$

Додавання для всіх можливих значень більших ніж дає функцію виживання $f(k;n,m)$ $k$ $g$

Pr (a_{(1)} > g) = Q (g; n, m) = \frac{(m - g) (\binom{m - g - 1}{n - 1})}{n (\binom{m}{n})} .

$\Pr(a_{(1)} \gt g) = Q(g;n,m)= \frac{(m-g)\binom{m-g-1}{n-1}}{n \binom{m}{n}}.$

Нехай - випадкова величина, задана найбільшим проміжком: $G_{n,m}$

G_{n, m} = max (a_{(1)}, a_{(2)} - a_{(1)}, \dots, a_{(n)} - a_{(n - 1)}) .

$G_{n,m} = \max\left(a_{(1)}, a_{(2)}-a_{(1)}, \ldots, a_{(n)}-a_{(n-1)}\right).$

(Це відповідає на запитання як оригінально оформлене, перш ніж його змінити, щоб включити проміжок між і .) $a_{(n)}$ $m$ Ми обчислимо його функцію виживання з якого легко виводиться весь розподіл . Метод - це динамічна програма, що починається з , для якої очевидно, що

P (g; n, m) = Pr (G_{n, m} > g),

$P(g;n,m)=\Pr(G_{n,m}\gt g),$

G_{n, m}

$G_{n,m}$

n = 1

$n=1$

\begin{matrix} (1) & P (g; 1, m) = Pr (G_{1, m} > 1) = \frac{m - g}{m}, g = 0, 1, \dots, m . \end{matrix}

$P(g;1,m) = \Pr(G_{1,m} \gt 1) = \frac{m-g}{m},\ g=0, 1, \ldots, m.\tag{1}$

Для більшого зауважте, що подія - це неперервне об'єднання події $n\gt 1$ $G_{n,m}\gt g$

a_{1} > g,

$a_{1} \gt g,$

для яких найперший проміжок перевищує , а окремі події $g$ $g$

a_{1} = k and G_{n - 1, m - k} > g, k = 1, 2, \dots, g

$a_{1}=k\text{ and } G_{n-1,m-k} \gt g, \ k=1, 2, \ldots, g$

для якого перший проміжок дорівнює а зазор, більший за виникає пізніше у вибірці. Закон сумарної ймовірності стверджує, що ймовірності цих подій додаються, звідси $k$ $g$

\begin{matrix} (2) & P (g; n, m) = Q (g; n, m) + \sum_{k = 1}^{g} f (k; n, m) P (g; n - 1, m - k) . \end{matrix}

$P(g;n,m) = Q(g;n,m) + \sum_{k=1}^g f(k;n,m) P(g;n-1,m-k).\tag{2}$

Закріпивши і виклавши двосторонній масив, індексований і , ми можемо обчислити , використовуючи заповнити перший рядок і заповнити кожен наступний рядок, використовуючи операції на рядок. Отже, таблицю можна заповнити операціями і всі таблиці для через можуть бути побудовані в операціях . $g$ $i=1,2,\ldots,n$ $j=1,2,\ldots,m$ $P(g;n,m)$ $(1)$ $(2)$ $O(gm)$ $O(gmn)$ $g=1$ $g=m-n+1$ $O(m^3n)$

Ці графіки показують функцію виживання при . Зі збільшенням граф рухається вліво, що відповідає зменшенню шансів великих прогалин. $g\to P(g;n,64)$ $n=1,2,4,8,16,32,64$ $n$

Закриті формули для можна отримати у багатьох спеціальних випадках, особливо для великих , але мені не вдалося отримати закриту формулу, що стосується всіх . Гарні наближення легко доступні, замінивши цю проблему аналогічною задачею на безперервні однорідні змінні. $P(g;n,m)$ $n$ $g,n,m$

Нарешті, очікування отримується шляхом підсумовування його функції виживання, починаючи з : $G_{n,m}$ $g=0$

E (G_{n, m}) = \sum_{g = 0}^{m - n + 1} P (g; n, m) .

$\mathbb{E}(G_{n,m}) = \sum_{g=0}^{m-n+1} P(g;n,m).$

Цей контурний графік очікування показує контури в , закінчуючи темне до світлого. $2, 4, 6, \ldots, 32$

— дзижчати
джерело

Пропозиція: рядок "Нехай - випадкова величина, задана найбільшим проміжком:", будь ласка, додайте останній проміжок . Сюжет вашого очікування відповідає моєму моделюванню в Монте-Карло.

G_{n, m}

$G_{n,m}$

m + 1 - a_{n}

$m+1-a_{n}$

— AaronBecker