Розподіл за відсортованими списками


10

Скажімо, у нас є упорядкований список предметів

[a, b, c, ... x, y, z, ...]

Я шукаю сімейство дистрибутивів із підтримкою в списку вище, яким керується деякий параметр альфа, так що:

  • Для альфа = 0 він призначає ймовірності 1 першому пункту, a вище, а 0 іншому. Тобто, якщо ми зразок із цього списку, із заміною ми завжди отримуємо a.
  • У міру збільшення альфа ми призначаємо більш високі та більш високі ймовірності для решти списку, дотримуючись впорядкованості списку, слідуючи ~ експоненціальному розпаду.
  • Коли альфа = 1, ми призначаємо однакову ймовірність для всіх елементів у списку, тому вибірки зі списку схожі на ігнорування його впорядкування.

Це дуже схоже на геометричний розподіл, але є деякі помітні відмінності:

  • Геометричний розподіл розподілу визначається за всіма натуральними числами. У моєму випадку вище, список має фіксований розмір.
  • Геометричний розподіл не визначено для альфа = 0.

1
Здається, ви описуєте сімейство усічених геометричних розподілів. Однак є нескінченно багато сімей, які якісно поводяться як ваш опис. Більше того, було б пояснити, для чого ви хочете використовувати таку сім’ю.
whuber

Дякую @whuber Так, я розумію, існує нескінченно багато дистрибутивів, які відповідають цьому опису. Якісь конкретні, які приходять на думку? У мене зараз система, яка вибирає перший елемент цього списку (представляє бали), але я хочу рандомізувати цей вибір (і параметризувати цю рандомізацію). Я не шукаю конкретного типу "розпаду" на основі альфа. Поки альфа = 0 не означає рандомізації, тобто вибір першого елемента, 1 являє собою "вибрати будь-який елемент", а альфа між 0 і 1 представляє "щось середнє" між цими двома альфами, було б досить добре.
Амеліо Васкес-Рейна

Відповіді:


11

Припустимо, , ранг елемента списку , має значення в для списку з елементами (зв'язки можуть бути розірвані випадковим чином). Тоді ми могли б визначити ймовірність вибору як: i { 0 , 1 , , n - 1 } n irii{0,1,,n1}ni

pi=αrik=1nαrk

Це в основному лише належним чином нормалізований усічений геометричний розподіл, і це також пов'язано з функцією Softmax . У спеціальному випадку використовуйте умову . Зауважте, що знаменник завжди може бути записаний у простому виразі закритої форми. Для воно бере значення , а для воно приймає значення .0 0 = 1 α < 1 1 - α nα=000=1α<1 α=1n1αn1αα=1n

З зрозуміло, що це просто призначає однакові ймовірності для кожного елемента. Як , це наближається до надання всієї маси ймовірностей першому елементу.α 0α=1α0

У списку з 10 елементами грубо експоненціальне зменшення, яке ви запитували, чітке з :α=0.5

p00.5005p10.2502p20.1251p30.0626p40.0313p50.0156p60.0078p70.0039p80.0020p90.0010

Наведено нижче графіки, як вірогідність вибору першого елемента змінюється на основі , використовуючи список довжиною 10.α

введіть тут опис зображення


Приємно. Це шлях розумніший, ніж я міг колись сподіватися.
Метью Друрі

@Matthew Це усічені геометричні розподіли, про які я згадував раніше.
whuber

4

Я спробую побудувати приклад з перших принципів.

Візьмемо три розподіли як наші будівельні блоки:

  • P - розподіл, що присвоює ймовірності один до першого елемента списку, нульовий всім іншим.
  • E - розподіл, що призначає ймовірність до першого елемента списку, до наступного тощо. Оскільки список є кінцевим, вони не будуть дорівнювати , але ми можемо нормалізуватися, щоб отримати розподіл ймовірностей. 112 1141
  • U - рівномірний розподіл за списком.

Тепер ми хочемо взяти однопараметричне сімейство позитивних опуклих комбінацій цих розподілів

α(т)П+β(т)Е+γ(т)U

де для всіх , з додатковою властивістю, що і . α(т)+β(т)+γ(т)=1т[0,1]α(0)=1γ(1)=1

Геометрично ми хочемо простежити криву в рівносторонній трикутник, що проходить між точками який починається в першому куті, а закінчується і в останньому. Крім того, оскільки ми хочемо, щоб розподіл виглядав "експоненціальним" в середні часи, ми хотіли б, щоб крива займала внутрішню частину трикутника за часом .(α(т),β(т),γ(т))(1,0,0),(0,1,0),(0,0,1)т(0,1)

Ось варіант кривої:

(1-т(1-т))(1-т,0,т)+т(1-т)(13,13,13)

Я сконструював цю роботу назад із властивостей, які ми хотіли б. Крива проходить по краю трикутника між початковою і закінчуючою вершинами. Решта формули - це просто опукла сума цієї крайової кривої та єдиної точки , яка штовхає криву вздовж краю у внутрішню частину часу .( 1(1-т,0,т)t(0,1)(13,13,13)т(0,1)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.