Як довести правильність алгоритму переміщення?

У мене є два способи скласти список предметів у випадковому порядку і я хотів би визначити, чи є вони однаково справедливими (неупередженими).

Перший метод, який я використовую, - це побудувати весь список елементів, а потім зробити переміщення на ньому (скажімо, перемішання Фішера-Йейта). Другий метод є скоріше ітераційним методом, який зберігає список перетасованим при кожній вставці. У псевдокоді функцією вставки є:

insert( list, item )
    list.append( item )
    swap( list.random_item, list.last_item )

Мене цікавить, як можна продемонструвати справедливість цього конкретного переміщення. Переваг цього алгоритму, де він використовується, достатньо, щоб навіть у випадку несправедливості це було б добре. Щоб вирішити, мені потрібен спосіб оцінити його справедливість.

Моя перша ідея полягає в тому, що мені потрібно обчислити загальну можливу перестановку таким чином проти загальної можливої перестановки для набору кінцевої довжини. Однак я трохи втрачаю те, як обчислити перестановки в результаті цього алгоритму. Я також не можу бути впевнений, що це найкращий чи найпростіший підхід.

— edA-qa mort-ora-y
джерело

Ви можете зробити статистичну вибірку за великою кількістю запусків свого алгоритму і порівняти його з очікуваним значенням або виконати якийсь тест на випадковість.

— Дейв Кларк

Ви хочете перевірити розподіл. Він рівномірно розподілений, або перекошений. Але я підозрюю, що вам доведеться запускати його багато-багато разів.

— Дейв Кларк

Мені не ясно, як я це зробив. Це не випадковість вмісту, за яким я переслідую, а випадковість впорядкування. Який підхід може виміряти розподіл замовлення?

— edA-qa mort-ora-y

Ах, нерозумно, я міг би використовувати фіксований набір входів і використовувати остаточне положення кожного елемента, щоб отримати розподіл. І все-таки я б вважав за краще скоріше логічний доказ, ніж моделювання.

— edA-qa mort-ora-y

@ edA-qamort-ora-y: Ваше бажання - це моя команда. ;)

— Рафаель

Спочатку зробимо два, можливо, очевидних, але важливих припущення:

_.random_item може вибрати останню позицію.
_.random_itemобирає кожну позицію з вірогідністю . $\frac{1}{n+1}$

Щоб довести правильність свого алгоритму, вам потрібен спонукальний аргумент, аналогічний використаному тут :

Для одиночного списку є лише одна можливість, тому його вибирають рівномірно.
$n$ $n+1$

^{Звідси доказ невірний. Про правильний доказ див. Нижче; Я залишаю це тут, тому що помилка та наступні кроки (які є здоровими) можуть бути навчальними.}

Корисно дістати місцеве (тобто елементне) властивість, яке має містити, тому що сперечатися про всю перестановку болісно. Зауважте, що перестановка вибирається рівномірно, якщо кожен елемент має однакову ймовірність перебування в кожній позиції, тобто

$\qquad \displaystyle \mathop{\forall}\limits_{\pi \in \mathrm{Perm}_n} \operatorname{Pr}(L = \pi) = \frac{1}{n!} \quad \Longleftrightarrow \quad \mathop{\forall}\limits_{i=1}^n\ \mathop{\forall}\limits_{j=1}^n \operatorname{Pr}(L_i = j) = \frac{1}{n} \qquad (1)$

$n = |L|$ $\{1,\dots,n\}$

$n+1$

$i \in \{1,\dots,n\}$ $j \in \{1,\dots,n\}$
$i = n+1$ $j \in \{1,\dots,n\}$
$i \in \{1,\dots,n+1\}$ $j = n+1$

$j$ $i$ $\frac{1}{n+1}$ $(1)$ $p_n = \frac{1}{n}$ $n$ $p_s = \frac{1}{n+1}$ random_item $n$

$\qquad \displaystyle \operatorname{Pr}(L_i=j, i \text{ swapped}) = \operatorname{Pr}(L_i=j)\cdot \operatorname{Pr}(i \text{ swapped}) = p_np_s$

$i,j \in \{1,\dots,n\}$

$n$ $j$ $i$ $i$

$\quad \displaystyle \operatorname{Pr}(L_i = j) = p_n(1-p_s) = \frac{1}{n}\cdot\frac{n}{n+1} = \frac{1}{n+1}$
$j$ $j$ $i$ $i$

$\quad \displaystyle \operatorname{Pr}(L_{n+1} = j) = \sum_{i=1}^n p_np_s = \sum_{i=1}^n \frac{1}{n}\cdot\frac{1}{n+1} = \frac{1}{n+1}$
$i$ $i$

$\quad \displaystyle \operatorname{Pr}(L_i = j) = p_s = \frac{1}{n+1}$

Все вийшло добре, ваша стратегія вставки дійсно зберігає однаковість. Силою індукції це доводить, що ваш алгоритм створює рівномірно розподілені перестановки.

^{Слово попередження: цей доказ розбивається, якщо вставлені елементи не є попарно різними, відповідно. відмітний, бо тоді саме перше рівняння вже не діє. Але ваш алгоритм все ще діє; кожна перестановка з дублікатами породжується однаковою кількістю випадкових страт. Ви можете довести це шляхом маркування дублікатів (тобто, зробивши їх помітними), виконайте вище тестування та видаліть маркування (практично); останній крок згортає рівні розміри перестановок на однакові.}

$(1)$

random_item $L^{(k)}$ $\{1,\dots,k\}$

$\pi' \in \mathrm{Perm}_{n+1}$ $\{1,\dots,n+1\}$

$\qquad \displaystyle \pi' = (\pi(1), \pi(2), \dots, \pi(i-1), n+1, \pi(i+1), \dots, \pi(n), \pi(i))$

$\pi \in \mathrm{Perm}_n$ $i \in \{1,\dots,n+1\}$ $\operatorname{Pr}(L^{(n)} = \pi) = \frac{1}{n!}$ random_item $i$ $\frac{1}{n+1}$ $\pi$ $i$

$\qquad \displaystyle \operatorname{Pr}(L^{(n+1)} = \pi') = \operatorname{Pr}(L^{(n)} = \pi) \cdot \operatorname{Pr}(i \text{ swapped}) = \frac{1}{(n+1)!}$

що нам довелося показати. Силою індукції це доводить, що ваш алгоритм створює рівномірно розподілені перестановки.

$\{(1, 2, 3, 4), (2, 3, 4, 1), (3, 4, 1, 2), (4, 1, 2, 3)\}$ $\frac{1}{4}$ $0$

— Рафаель
джерело

"Зауважте, що перестановка вибирається рівномірно, якщо кожен елемент має однакову ймовірність перебування на кожній позиції" - це неправда. Наприклад, безліч чотирьох перестановок на чотири елементи {(1, 2, 3, 4), (2, 3, 4, 1), (3, 4, 1, 2), (4, 1, 2, 3 )} задовольняє ваше обмеження, але очевидно, це не безліч усіх перестановок. На жаль, вам доведеться використовувати глобальні властивості перестановки, тому що для визначення однорідності недостатньо локальних умов.

— Стівен Стадницький