Чи рівномірно розподілені відмінності між рівномірно розподіленими числами?


22

Велику кількість разів катаємо 6-сторонні штампи.

Обчислюючи різницю (абсолютне значення) між рулоном та його попереднім рулоном, чи очікується, що різниці розподіляться рівномірно?

Для ілюстрації з 10 рулонів:

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

Чи diffрозподіляли б значення рівномірно?


13
Побудуйте гістограму , по крайней мере , отримати почуття
Гюнеш


Це виглядає як домашнє завдання ....
Ману Х

@ Ману Н, запевняю, дні для домашніх завдань далеко за мною
HeyJude

Відповіді:


37

Ні, вона не є рівномірною

Можна порахувати 36 однаково вірогідних можливостей абсолютних різниць

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

що дає розподіл ймовірності для абсолютних різниць

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18

27
@onurcanbektas Таблиця в цій відповіді явно суперечить вашому твердженню: наприклад, видно, що лише одна з можливих різниць становить 5, тоді як 6 з них 0. Оскільки всі 36 можливостей однаково вірогідні, це неоднаково.
whuber

13
@onurcanbektas Я запрошую вас ще раз поміркувати за столом. Оскільки він має лише дві абсолютні різниці 5, чи не очевидно, що не більше двох різниць може дорівнювати 5?
whuber

14
@onurcanbektas Для простих відмінностей (тобто зі знаками, так цілі числа від -5, хоча до +5), розподіл - це симетричний дискретний трикутний розподіл з режимом (найімовірніше значення) при 0. Для абсолютних відмінностей, як показано у моїй відповіді, режим - 1.
Генрі

2
Можливо, варто зазначити, що підписаний різницевий модуль 6 розподілений рівномірно.
Федеріко Полоні

2
@FedericoPoloni Це не тривіально очевидно? Я маю на увазі, що я ніколи не дуже про це, перш ніж читати коментар, але цілком очевидно, що це просто має бути правдою
Cruncher,

21

Використовуючи лише найосновніші аксіоми щодо ймовірностей та дійсних чисел, можна довести набагато сильніше твердження:

Різниця будь-яких двох незалежних, однаково розподілених неконстантних випадкових значень XY ніколи не має дискретного рівномірного розподілу.

(Аналогічне твердження для безперервних змінних доведено в Уніфікованому PDF різниці двох обертів .)

Ідея полягає в тому, що шанс XY є крайнім значенням повинен бути меншим, ніж шанс, що Х-Y дорівнює нулю, оскільки існує лише один спосіб (скажімо) максимізувати Х-Y тоді як існує багато способів зробити різницю нульовою , оскільки Х і Y мають однаковий розподіл і тому можуть дорівнювати один одному. Ось деталі.

Спершу зауважте, що відповідні гіпотетичні дві змінні Х і Y можуть досягти лише кінцевого числа н значень з позитивною ймовірністю, оскільки буде принаймні n чітких відмінностей, і рівномірний розподіл призначає їм всі рівні ймовірності. Якщо n нескінченно, то так би було число можливих різниць, що мають позитивну, рівну ймовірність, звідки сума їх шансів була б нескінченною, що неможливо.

Далі , оскільки кількість відмінностей скінченна, серед них буде найбільша кількість. Найбільша різниця може бути досягнута лише при відніманні найменшого значення виклику Y --лету m і припустимо, що він має ймовірність q=Pr(Y=m) --від найбільшого значення виклику X --let, що той M з p=Pr(X=M). Тому щоX іY незалежні, ймовірність цієї різниці є результатом цих шансів,

(*)Pr(XY=Mm)=Pr(X=M)Pr(Y=m)=pq>0.

Нарешті , оскільки X і Y мають однакове розподіл, є багато способів їх відмінності можуть продукувати значення 0. Серед цих способів є випадки , коли X=Y=m і X=Y=M. Оскільки цей розподіл непостійне, m відрізняється від M.Це показує, що ці два випадки є непересічними подіями, і тому вони повинні внести принаймні суму p2+q2 до шансу, щоXYдорівнює нулю; це є,

Pr(XY=0)Pr(X=Y=m)+Pr(X=Y=M)=p2+q2.

Оскільки квадрати чисел не від'ємні, 0(pq)2, звідки виведемо з () що

Pr(XY=Mm)=pqpq+(pq)2=p2+q2pq<p2+q2Pr(XY=0),

показує розподіл XY не рівномірно, QED.

Редагувати у відповідь на коментар

Аналогічний аналіз абсолютних різниць |XY|зазначає , що , так як X і Y мають однакове розподіл, m=M.Це вимагає від нас вивчення Pr(XY=|Mm|)=2pq.Та сама алгебраїчна техніка дає майже такий же результат, але існує ймовірність, що 2pq=2pq+(pq)2 і 2pq+p2+q2=1. Ця система рівнянь має єдине рішенняp=q=1/2 , що відповідає справедливій монети (а «двосторонній померти»). Крім цього винятку, результат для абсолютних різниць такий самий, як і для відмінностей, і з тих самих наведених причин: а саме абсолютні відмінності двох iid випадкових величин не можуть бути рівномірно розподілені, коли існує більше двох чітких відмінностей з позитивною ймовірністю.

(кінець редагування)


Давайте застосуємо цей результат до питання, яке задає щось трохи складніше.

Моделюйте кожен незалежний рулон штамп (що може бути несправедливим штампом) випадковою змінною Xi, i=1,2,,n. Відмінності, які спостерігаються в цих n рулонах, - це числа ΔXi=Xi+1Xi. Нам може бути цікаво, наскільки рівномірно розподілені ці n1 числа. Це справді питання щодо статистичних очікувань: яка очікувана кількість ΔXi , наприклад, нулю? Яка очікувана кількість ΔXi дорівнює1 ? І т.д.

Проблемним аспектом цього питання є те, що ΔXi не є незалежними: наприклад, ΔX1=X2X1 і ΔX2=X3X2 включають один і той же рулон X2.

Однак це насправді не складно. Оскільки статистичне очікування є адитивним, і всі відмінності мають однаковий розподіл, якщо ми виберемо будь-яке можливе значення k різниці, очікувана кількість разів різниця дорівнює k у всій послідовності n рулонів, що становить лише n1 рази більше очікуваної кількості разів різниця дорівнює k на одному кроці процесу. Це однокрокове очікування Pr(ΔXi=k) (для будь-якого i ). Ці очікування будуть однаковими для всіх k (тобто рівномірними ) тоді і лише тоді, коли вони однакові для одного ΔXi. But we have seen that no ΔXi has a uniform distribution, even when the die might be biased. Thus, even in this weaker sense of expected frequencies, the differences of the rolls are not uniform.


@Michael Хороший момент: я відповів на запитання як на запитання (яке стосується "відмінностей"), а не як проілюстровано (що чітко стосується абсолютних відмінностей). Застосовується та сама техніка - просто потрібно враховувати і максимум, і мінімум відмінностей. У тому випадку , якщо тільки ці дві можливості (разом з нулем), можна отримати рівність, яке де Бернуллі результат виходить з (показуючи , що це єдиний такий приклад). (1/2)
whuber

Ще одна відповідь, що підтверджує певну версію цього, є тут .
Відновіть Моніку

Thanks, @Ben: I had forgotten that thread. Because it's a better reference, I now link directly to it in this answer.
whuber

12

On an intuitive level, a random event can only be uniformly distributed if all of its outcomes are equally likely.

Is that so for the random event in question -- absolute difference between two dice rolls?

It suffices in this case to look at the extremes -- what are the biggest and smallest values this difference could take?

Obviously 0 is the smallest (we're looking at absolute differences and the rolls can be the same), and 5 is the biggest (6 vs 1).

We can show the event is non-uniform by showing that 0 is more (or less) likely to occur than 5.

At a glance, there are only two ways for 5 to occur -- if the first dice is 6 and the second 1, or vice versa. How many ways can 0 occur?


1
+1 I think this gets to the heart of the matter. I have posted a generalization of the question that ultimately relies on the same observation.
whuber

5

As presented by Henry, differences of uniformly distributed distributions are not uniformly distributed.

To illustrate this with simulated data, we can use a very simple R script:

barplot(table(sample(x=1:6, size=10000, replace=T)))

enter image description here

We see that this produces indeed a uniform distribution. Let's now have a look at the distribution of the absolute differences of two random samples from this distribution.

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

enter image description here


6
Why does this have anything to do with the CLT, which concerns the asymptotic distribution of means of large numbers of iid values?
whuber

2
I like the connection you originally made with CLT. Let n be the number of samples to be added (or subtracted) from the original uniform distribution. CLT implies that for large n the distribution will tend toward normal. This in turn implies that the distribution cannot remain uniform for any n>1, such as n=2 which is what OP is asking. (If this isn't self-explanatory, consider that if the sum were uniformly distributed when n=2, reindexing would imply that it is also uniform when n=4, etc, including for large n.)
krubo

3
@Krubo Оригінальне запитання задає питання про розподіл відмінностей між послідовними рулонами штампу. CLT про це нічого не може сказати. Дійсно, незалежно від того, скільки разів котиться штамп, розподіл цих відмінностей не наближатиметься до нормальності.
whuber

Does this distribution tend to uniform as the number of die faces tends to infinity? Not sure how to go about showing that, but intuitively it feels like it heads in that direction, but I don't know if it get asymptotically "blocked" somewhere before flattening enough
Cruncher

@Cruncher you can easily change the number of die faces in the R-Code. The more faces there are, the more apparent the stairwairs nature of the distribution becomes. '1' is always the peak of that stair and with larger differences the probabilities approximate zero. Additionally, difference of '0' is distinctly rarer than '1'. (at least if the die's smallest value is '1')
LuckyPal

2

Others have worked the calculations, I will give you an answer that seems more intuitive to me. You want to study the sum of two unifrom r.v. (Z = X + (-Y)), the overall distribution is the (discrete) convolution product :

P(Z=z)=k=P(X=k)P(Y=zk)

This sum is rather intuitive : the probability to get z, is the sum of the probabilities to get something with X (noted k here) and the complement to z with -Y.

From signal processing, we know how the convolution product behave:

  • The convolution product of two uniform function (two rectangles) will give a triangle. This is illustrated by wikipedia for continuous functions:

enter image description here

  • You can understand what happen here : as z move up (the vertical dotted line) the common domain of both rectangle move up then down, which correspond to the probability to get z.

  • More generally we know that the only functions that are stable by convolution are those of the gaussian familly. i.e. Only gaussian distribution are stable by addition (or more generally, linear combination). This is also meaning that you don't get a uniform distribution when combining uniform distributions.

As to why we get those results, the answer lies in the Fourrier decomposition of those functions. The Fourrier transformation of a convolution product being the simple product of the Fourrier transformations of each function. This give direct links between the fourrier coefficients of the rectangle and triangle functions.


Please check the validity of your claims and the logic of your answer. The question isn't whether the convolution of two uniform distributions is uniform: it's whether the convolution of some distribution and its reversal can be uniform. And there are far more distributional families than the Gaussian that are stable under convolution (modulo standardization, of course): see en.wikipedia.org/wiki/Stable_distribution
whuber

You are right about stable distributions. For the question, I am pretty sure this is about the difference of two random values with uniform distribution (as indicated by the title). The question whether the convolution of some distribution and its reversal can be uniform is larger than what is asked here.
lcrmorin

1

If x and y are two consecutive dice rolls, you can visualize |xy|=k (for k=0,1,2,3,4,5) as follows where each color corresponds to a different value of k:

consecutive dice rolls difference visualization

As you can easily see, the number of points for each color is not the same; therefore, the differences are not uniformly distributed.


0

Let Dt denote the difference and X the value of the roll, then P(Dt=5)=P(Xt=6,Xt1=1)<P((Xt,Xt1){(6,3),(5,2)})<P(Dt=3)

So the function P(Dt=d) is not constant in d. This means that the distribution is not uniform.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.