Який розподіл для різних багатогранних кісток, які згортаються відразу?


15

Візьміть 5 платонічних твердих тіл з набору кісток Dungeons & Dragons. Вони складаються з 4-х, 6-сторінних (звичайних), 8-сторонніх, 12-сторонніх та 20-сторонніх кісток. Усі починаються з числа 1 і підраховують вгору на 1 до їх загальної кількості.

Згорніть їх усі відразу, візьміть їх суму (мінімальна сума - 5, макс - 50). Зробіть це кілька разів. Що таке розподіл?

Очевидно, що вони будуть прагнути до нижнього кінця, оскільки є більш низькі числа, ніж вищі. Але чи будуть помітні точки перегину на кожній межі окремого відмирання?

[Редагувати: Мабуть, те, що здавалося очевидним, не є. За словами одного з коментаторів, середнє значення становить (5 + 50) /2=27,5. Я цього не очікував. Я все одно хотів би побачити графік.] [Edit2: Більше сенсу бачити, що розподіл n кубиків є однаковим, як і всі кістки окремо, додані разом.]


1
Ви маєте на увазі, який розподіл суми дискретних уніформ [1,4]+[1,6]+[1,8]+[1,12]+[1,20] ?
gung - Відновити Моніку

2
Один із способів її вивчення - це моделювання. В R : hist(rowSums(sapply(c(4, 6, 8, 12, 20), sample, 1e6, replace = TRUE))). Він насправді не прагне до нижнього кінця; з можливих значень від 5 до 50, середнє значення становить 27,5, а розподіл (візуально) не далеко від нормального.
Девід Робінсон

2
Мій набір D&D має d10, а також 5 згаданих вами (плюс декадер, який, я вважаю, ви не включаєте)
Glen_b -Встановити Моніку

1
Вольфрам Альфа точно обчислює відповідь . Ось функція , що генерує ймовірність , з якої можна зчитувати розподіл безпосередньо. До речі, це питання є особливим випадком, коли його задають і ретельно відповідають на сайті stats.stackexchange.com/q/3614 та stats.stackexchange.com/questions/116792 .
whuber

2
@AlecTeal: Легко там, крутий хлопець. Якби ви зробили своє дослідження, ви побачили, що я не мав омпутника, щоб сам запустити моделювання. І котившись 100 разів, не здавалося настільки ефективним для такого простого питання.
Маркос

Відповіді:


18

Я б не хотів це робити алгебраїчно, але ви можете обчислити pmf досить просто (це просто згортання, що дуже просто в електронній таблиці).

Я обчислював їх у таблиці *:

i        n(i)   100 p(i)
5         1     0.0022
6         5     0.0109
7        15     0.0326
8        35     0.0760
9        69     0.1497
10      121     0.2626
11      194     0.4210
12      290     0.6293
13      409     0.8876
14      549     1.1914
15      707     1.5343
16      879     1.9076
17     1060     2.3003
18     1244     2.6997
19     1425     3.0924
20     1597     3.4657
21     1755     3.8086
22     1895     4.1124
23     2014     4.3707
24     2110     4.5790
25     2182     4.7352
26     2230     4.8394
27     2254     4.8915
28     2254     4.8915
29     2230     4.8394
30     2182     4.7352
31     2110     4.5790
32     2014     4.3707
33     1895     4.1124
34     1755     3.8086
35     1597     3.4657
36     1425     3.0924
37     1244     2.6997
38     1060     2.3003
39      879     1.9076
40      707     1.5343
41      549     1.1914
42      409     0.8876
43      290     0.6293
44      194     0.4210
45      121     0.2626
46       69     0.1497
47       35     0.0760
48       15     0.0326
49        5     0.0109
50        1     0.0022

Тут - кількість способів отримання кожного загального i ; p ( i ) - ймовірність, де p ( i ) = n ( i )n(i)ip(i) . Найімовірніші результати трапляються менше 5% часу.p(i)=n(i)/46080

Вісь у ймовірності виражається у відсотках. введіть тут опис зображення

* Метод, який я використав, аналогічний описаній тут процедурі , хоча точна механіка, яка бере участь у його налаштуванні, змінюється, коли змінюються деталі користувальницького інтерфейсу (цьому посту вже близько 5 років, хоча я оновив його близько року тому). І я цього разу використовував інший пакет (я цього разу робив це в Calc LibreOffice). І все-таки в цьому суть.


Дивовижно, я взагалі не очікував симетричного розподілу. Я не впевнений, чому моя інтуїція була настільки далекою.
Маркос

6
Сума незалежних симетричних випадкових величин також симетрична в розподілі.
Glen_b -Встановіть Моніку

Гарне правило. Це десь опубліковано?
Маркос

3
Так, але моя думка полягала в тому, що це надто банально, щоб отримати журнал для його публікації, це було б поставлено лише як вправу для студента. Ви можете використати той факт, що характерна функція випадкової змінної, яка симетрична навколо походження, є реальною і рівною (який факт ви можете знайти, зазначений на сторінці Вікіпедії на характерній функції ) - ну, і я думаю, вам потрібна -для однієї властивості cfs vs pmfs також або використовуйте подвійне відношення, щоб встановити, що рівний cf також передбачає симетричний pmf ...
Glen_b -Встановити Моніку

2
... і той факт, що добуток парних функцій є рівним, але насправді це очевидно лише з прямого розгляду того, як працює згортання - у згортанні двох симетричних функцій (у цьому випадку pmfs), для кожного терміна в сумі продуктів на одному кінці є відповідний член одного розміру на іншому кінці, симетрично розміщений навколо центру.
Glen_b -Встановіть Моніку

7

Тому я зробив цей код:

d4 <- 1:4  #the faces on a d4
d6 <- 1:6  #the faces on a d6
d8 <- 1:8  #the faces on a d8
d10 <- 1:10 #the faces on a d10 (not used)
d12 <- 1:12 #the faces on a d12
d20 <- 1:20 #the faces on a d20

N <- 2000000  #run it 2 million times
mysum <- numeric(length = N)

for (i in 1:N){
     mysum[i] <- sample(d4,1)+
                 sample(d6,1)+
                 sample(d8,1)+
                 sample(d12,1)+
                 sample(d20,1)
}

#make the plot
hist(mysum,breaks = 1000,freq = FALSE,ylim=c(0,1))
grid()

Результат - це сюжет. введіть тут опис зображення

Це досить гауссово виглядає. Я думаю, що ми (знову ж таки), можливо, продемонстрували варіацію центральної граничної теореми.


2
Хм, найнижчий рулон у вашому моделюванні - 6. Імовірність його прокатки (або будь-якого одного рулону, збереження ідентичності штампу) становить 1: 4 * 1: 6 * 1: 8 * 1: 10 * 1: 12 * 1: 20 = 1: 460800. Мої процедури вимагають вибірки розміром N принаймні вдвічі (можливо, в 4 рази) цієї суми (як обмеження Nyquist), щоб виявити помилки в моєму моделюванні.
Маркос

Мій досвід роботи з Nyquist також говорить про мінімум 4 рази. ... зроблено. Якщо 2 мільйонів недостатньо, дайте мені знати, що це повинно бути.
EngrStudent

3
n

1
@EngrStudent: BTW, чи не підтверджує ваш результат CLT?
Маркос

1
@theDoctor ні, це не підтверджує CLT з безлічі причин
Glen_b -Встановити Моніку

7

Трохи допоможе вашій інтуїції:

Спочатку подумайте, що станеться, якщо ви додасте його до всіх граней одного штампу, наприклад, d4. Отже, замість 1,2,3,4 на обличчях тепер показано 2,3,4,5.

Порівнюючи цю ситуацію з початковою, неважко помітити, що загальна сума зараз на один вищий, ніж раніше. Це означає, що форма розподілу незмінна, вона просто переміщується на один крок убік.

Тепер віднімаємо середню величину кожного штампу з кожної сторони, що відмирає.

Це дає позначення кісток

  • 32121232
  • 523212123252
  • 7252321212325272

тощо.

Тепер сума цих кубиків повинна мати таку ж форму, що й оригінальна, лише зміщена вниз. Повинно бути зрозуміло, що ця сума симетрична навколо нуля. Тому оригінальний розподіл також симетричний.


4

P(X=i)=p(i)
Xi0,1,,n(0,1/6,1/6,1/6,1/6,1/6,1/6)p(t)=06p(i)tiq(j)j0,1,,mp(t)q(t)
> p  <-  q  <-  c(0, rep(1/6,6))
> pq  <-  convolve(p,rev(q),type="open")
> zapsmall(pq)
 [1] 0.00000000 0.00000000 0.02777778 0.05555556 0.08333333 0.11111111
 [7] 0.13888889 0.16666667 0.13888889 0.11111111 0.08333333 0.05555556
[13] 0.02777778

і ви можете перевірити, що це правильно (ручним розрахунком). Тепер для справжнього питання, п’ять кубиків із 4,6,8,12,20 сторонами. Я буду робити розрахунок, передбачаючи однакові проби для кожної кістки. Потім:

> p1  <-  c(0,rep(1/4,4))
> p2 <-  c(0,rep(1/6,6))
> p3 <-  c(0,rep(1/8,8))
> p4  <-  c(0, rep(1/12,12))
> p5  <-  c(0, rep(1/20,20))
> s2  <-  convolve(p1,rev(p2),type="open")
> s3 <-  convolve(s2,rev(p3),type="open")
> s4 <-  convolve(s3,rev(p4),type="open")
> s5 <- convolve(s4, rev(p5), type="open")
> sum(s5)
[1] 1
> zapsmall(s5)
 [1] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00002170
 [7] 0.00010851 0.00032552 0.00075955 0.00149740 0.00262587 0.00421007
[13] 0.00629340 0.00887587 0.01191406 0.01534288 0.01907552 0.02300347
[19] 0.02699653 0.03092448 0.03465712 0.03808594 0.04112413 0.04370660
[25] 0.04578993 0.04735243 0.04839410 0.04891493 0.04891493 0.04839410
[31] 0.04735243 0.04578993 0.04370660 0.04112413 0.03808594 0.03465712
[37] 0.03092448 0.02699653 0.02300347 0.01907552 0.01534288 0.01191406
[43] 0.00887587 0.00629340 0.00421007 0.00262587 0.00149740 0.00075955
[49] 0.00032552 0.00010851 0.00002170
> plot(0:50,zapsmall(s5))

Сюжет показаний нижче:

введіть тут опис зображення

Тепер ви можете порівняти це точне рішення із симуляціями.


1

Центральна гранична теорема відповідає на ваше запитання. Незважаючи на те, що його деталі та докази (та стаття у Вікіпедії) дещо згинають мозок, суть цього проста. У Вікіпедії це сказано

сума ряду незалежних і однаково розподілених випадкових змінних з кінцевими дисперсіями буде мати тенденцію до нормального розподілу в міру зростання кількості змінних.

Ескіз доказу вашої справи:

Коли ви говорите «киньте всі кістки відразу», кожен рулон усіх кісток є випадковою змінною.

На ваших кубиках надруковані кінцеві числа. Тому сума їх значень має кінцеву дисперсію.

Кожен раз, коли ви перекидаєте всі кістки, розподіл ймовірностей результату однаковий. (Кістки не змінюються між рулонами.)

Якщо ви котитимете кістки справедливо, то кожен раз, коли ви їх робите, результат буде незалежним. (Попередні рулони не впливають на майбутні рулони.)

Незалежний? Перевірити. Ідентично розподілений? Перевірити. Кінцева дисперсія? Перевірити. Тому сума прагне до нормального розподілу.

Навіть не було б важливо, чи розподіл для одного рулону всіх кісток було однобічним у напрямку до нижнього кінця. Я не мав би значення, чи були в цьому дистрибутиві кукси. Все підсумовування згладжує його і робить його симетричним гауссом. Вам навіть не потрібно робити якусь алгебру чи симуляцію, щоб показати це! Це дивовижне розуміння CLT.


3
Незважаючи на те, що CLT є актуальним, і як показують інші публікації, дистрибуції виглядають приблизно в гауссі, ми маємо справу лише з сумою 5 незалежних неідентичних дистрибуцій. Тож точка 1) 5 насправді не є достатньо великою, щоб викликати теорему, яка застосовується "у нескінченність". Точка 2) Ви не можете використовувати CLt ванілі, тому що речі, які ви сумуєте, не є iid. Вам потрібен CLT Ляпунова, я думаю.
Петро

2
Вам не потрібно теореми центрального граничного значення, щоб сказати, що сума деяких незалежних випадкових величин з симетричними розподілами щодо їх відповідних центрів має симетричне розподіл щодо суми центрів.
Генрі

@ Peeter: Ти не вистачаєш структури мого доказу. ОП каже: "розкажіть їх усі відразу". Я беру кожний рулон усіх кісток як одну випадкову змінну. Ці випадкові змінні мають ідентичне розподіл. Не потрібно Ляпунові. Крім того, в ОП сказано "зроби так багато разів", що я вважаю "в межах межі", тому ваш пункт №1 недійсний. Тут ми не просто підсумовуємо один рулон з 5 кісток.
Пол Кантрелл

2
@PaulCantrell Кожен рулон усіх кубиків - це сума п'яти незалежних не однаково розподілених змінних. ОП просить про розподіл цієї суми. Ви можете зробити багато рулонів із 5-ти кубиків, але це просто вибірка з розглядуваної дистрибуції, ніхто не підсумовує ці зразки.
Пітер

1
@PaulCantrell Я думаю, це залежить від того, як ви інтерпретуєте "Зроби так багато разів". Зробіть це кілька разів, і вони підсумовуються ще раз (отримуючи єдине значення) або зробіть це кілька разів і подивіться на гістограму цих зразків (отримання кількох значень). Я взяв останнє тлумачення.
Петро
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.