Хоча точну ймовірність неможливо обчислити (за винятком особливих обставин з ), її можна чисельно обчислити швидко з високою точністю. Незважаючи на це обмеження, можна суворо довести, що бігун з найбільшим стандартним відхиленням має найбільші шанси на перемогу. На малюнку зображена ситуація і показано, чому цей результат інтуїтивно очевидний:n≤2
Показані щільності ймовірності для часів п’яти бігунів. Усі неперервні та симетричні щодо загального середнього μ . (Масштабована бета-щільність використовувалася для того, щоб усі часи були позитивними.) Одна щільність, намальована темно-синім кольором, має набагато більший розкид. Видима частина його лівого хвоста відображає моменти, з якими зазвичай не може відповідати жоден інший бігун. Оскільки той лівий хвіст із його відносно великою площею представляє помітну ймовірність, бігун із цією щільністю має найбільший шанс виграти гонку. (Вони також мають найбільший шанс вступити останнім часом!)
Ці результати підтверджені для більш ніж звичайних розподілів: наведені тут методи однаково добре застосовуються до розподілів, які є симетричними та безперервними. (Це буде цікаво для всіх, хто заперечує проти використання нормальних розподілів для моделювання часу роботи.) Якщо ці припущення порушені, можливо, бігун з найбільшим стандартним відхиленням може не мати найбільших шансів на перемогу (я залишаю побудову контрприкладів на зацікавлені читачі), але ми все ще можемо довести при м'яких припущеннях, що бігун з найбільшою SD матиме найкращі шанси на перемогу за умови, що SD достатньо великий.
На рисунку також випливає, що такі ж результати можна отримати, розглядаючи односторонні аналоги стандартного відхилення (так звана "напівваріантність"), які вимірюють дисперсію розподілу лише на одну сторону. Бігун з великою дисперсією ліворуч (у кращі часи) повинен мати більший шанс на перемогу, незалежно від того, що відбувається в решті розподілу. Ці міркування допомагають нам оцінити, чим властивість бути кращим (у групі) відрізняється від інших властивостей, таких як середні.
Нехай - випадкові величини, що представляють час бігунів. Питання передбачає, що вони незалежні та зазвичай розподілені із загальним середнім μ . (Хоча це буквально неможлива модель, оскільки вона має позитивні ймовірності за негативних часів, вона все ще може бути розумним наближенням до реальності за умови, що стандартні відхилення істотно менші за мк .)X1,…,Xnμμ
Для того, щоб здійснити наступний аргумент, збережіть припущення про незалежність, але в іншому випадку припустімо, що розподіли задані F i, і ці закони розподілу можуть бути будь-якими. Для зручності також припустимо, що розподіл F n є безперервним з щільністю f n . Пізніше, за необхідності, ми можемо застосувати додаткові припущення за умови, що вони стосуються випадку звичайних розподілів.XiFiFnfn
Для будь-якого та нескінченно малого d y , шанс того, що останній бігун має час в інтервалі ( y - d y , y ] і є найшвидшим бігуном, отримується шляхом множення всіх відповідних ймовірностей (тому що всі часи незалежні):ydy(y−dy,y]
Pr(Xn∈(y−dy,y],X1>y,…,Xn−1>y)=fn(y)dy(1−F1(y))⋯(1−Fn−1(y)).
Інтеграція всіх цих взаємовиключних можливостей дає можливість
Pr(Xn≤min(X1,X2,…,Xn−1))=∫Rfn(y)(1−F1(y))⋯(1−Fn−1(y))dy.
Для нормальних розподілів цей інтеграл неможливо оцінити у закритому вигляді, коли n>2 : йому потрібна чисельна оцінка.
Цей малюнок побудує інтеграл для кожного з п’яти бігунів, що мають стандартні відхилення у співвідношенні 1: 2: 3: 4: 5. Чим більше SD, тим більше функція зміщується вліво - і тим більшою стає її площа. Площі приблизно 8: 14: 21: 26: 31%. Зокрема, у бігуна з найбільшим SD є 31% шансів на перемогу.
Незважаючи на те, що закритої форми знайти неможливо, ми все одно можемо зробити ґрунтовні висновки та довести, що бігун із найбільшою SD найімовірніше виграє. Нам потрібно вивчити, що відбувається, коли змінюється стандартне відхилення одного з розподілів, скажімо, . Коли випадкова величина X n перераховується на σ > 0 навколо її середнього, її SD множиться на σ і f n ( y ) d y зміниться на f n ( y / σ ) d y / σFnXnσ>0σfn(y)dyfn(y/σ)dy/σ . Внесення змінної змінної в інтеграл дає вираз для шансу бігуна n виграти, як функцію σ :y=xσnσ
ϕ(σ)=∫Rfn(y)(1−F1(yσ))⋯(1−Fn−1(yσ))dy.
Suppose now that the medians of all n distributions are equal and that all the distributions are symmetric and continuous, with densities fi. (This certainly is the case under the conditions of the question, because a Normal median is its mean.) By a simple (locational) change of variable we may assume this common median is 0; the symmetry means fn(y)=fn(−y) and 1−Fj(−y)=Fj(y) for all y. These relationships enable us to combine the integral over (−∞,0] with the integral over (0,∞) to give
ϕ(σ)=∫∞0fn(y)(∏j=1n−1(1−Fj(yσ))+∏j=1n−1Fj(yσ))dy.
The function ϕ is differentiable. Its derivative, obtained by differentiating the integrand, is a sum of integrals where each term is of the form
yfn(y)fi(yσ)(∏j≠in−1Fj(yσ)−∏j≠in−1(1−Fj(yσ)))
for i=1,2,…,n−1.
The assumptions we made about the distributions were designed to assure that Fj(x)≥1−Fj(x) for x≥0. Thus, since x=yσ≥0, each term in the left product exceeds its corresponding term in the right product, implying the difference of products is nonnegative. The other factors yfn(y)fi(yσ) are clearly nonnegative because densities cannot be negative and y≥0. We may conclude that ϕ′(σ)≥0 for σ≥0, proving that the chance that player n wins increases with the standard deviation of Xn.
This is enough to prove that runner n will win provided the standard deviation of Xn is sufficiently large. This is not quite satisfactory, because a large SD could result in a physically unrealistic model (where negative winning times have appreciable chances). But suppose all the distributions have identical shapes apart from their standard deviations. In this case, when they all have the same SD, the Xi are independent and identically distributed: nobody can have a greater or lesser chance of winning than anyone else, so all chances are equal (to 1/n). Start by setting all distributions to that of runner n. Now gradually decrease the SDs of all other runners, one at a time. As this occurs, the chance that n wins cannot decrease, while the chances of all the other runners have decreased. Consequently, n has the greatest chances of winning, QED.