Чи слід вважати, що 58% шансів на перемогу є фіксованими і що очки незалежні?
Я вважаю, що відповідь Вюбера є вдалою і красиво написаною та поясненою, якщо врахувати, що кожна точка незалежна від наступної . Однак я вважаю, що на практиці це лише цікавий вихідний пункт (теоретичний / ідеалізований). Я думаю, що насправді очки не залежать одна від одної, і це може зробити більш-менш ймовірним, що ваш опонент-колега отримає виграш хоча б один раз з 50.
Спочатку я уявляв, що залежність очок буде випадковим процесом , тобто не контролюється гравцями (наприклад, коли хтось виграє або програє, граючи по-іншому), і це повинно створити більшу дисперсію результатів, що допоможе меншому гравцеві отримати це один бал із п’ятдесяти.
Однак друга думка може припустити протилежне : той факт, що ви вже «досягли» чогось із 9,7% шансів, може дати певну (але лише незначну) користь, з байєсівської точки зору, ідеям переваги механізмів, які спонукають вас до виграти більше 85% ймовірності виграти гру (або принаймні зробити меншою ймовірність того, що ваш опонент має набагато більшу ймовірність, ніж 15%, як це було аргументовано у попередніх двох абзацах). Наприклад, може бути так, що ви забиваєте краще, коли ваша позиція менш хороша (не дивно, що люди забивають набагато більше за бали матчів, на користь чи проти, ніж на звичайні очки). Ви можете покращити оцінки 85%, враховуючи цю динаміку, і, можливо, у вас є більше 85% ймовірності виграти гру.
У будь-якому випадку, може бути дуже неправильним використання цієї простої статистики балів для надання відповіді. Так, ви можете це зробити, але це не буде правильно, оскільки приміщення (незалежність балів) не обов'язково правильні і сильно впливають на відповідь . Статистика 42/58 - це більше інформації, але ми не дуже добре знаємо, як її використовувати (правильність моделі), а використання інформації може дати відповіді з високою точністю, якої вона насправді не має.
Приклад
Приклад: однаково розумна модель із зовсім іншим результатом
Тож гіпотетичне запитання (якщо припустити незалежні моменти та відомі, теоретичні, ймовірності для цих точок) саме по собі є цікавим і на нього можна відповісти, але просто дратувати та скептично / цинічно; відповідь на гіпотетичний випадок не стосується вашої основної / первісної проблеми, і може бути тому, що статистики / науковці даних у вашій компанії не хочуть давати прямої відповіді.
Просто навести альтернативний приклад (не обов’язково кращий), який дає заплутане (зустрічне) твердження: "Питання: яка ймовірність виграти всі 50 ігор, якщо я вже виграв 15?" Якщо ми не почнемо думати, що «бальні показники 42/58 є релевантними або дають нам кращі прогнози», тоді ми б почали робити прогнози щодо вашої ймовірності виграти гру та прогнозуєте виграти ще 35 ігор виключно на основі ваших раніше виграних 15 ігор:
- з байєсівською технікою для вашої ймовірності виграти гру це означатиме: що становить приблизно 31% для рівномірного попереднього f (x) = 1, хоча це може бути занадто оптимістично. Але якщо ви розглядаєте бета-розподіл з між 1 і 5, ви отримуєте:p(win another 35 | after already 15)=∫10f(p)p50∫10f(p)p15β=α
це означає, що я не був би таким песимістичним, як відвертий прогноз на 0,432% . Те, що ви вже виграли 15 ігор, повинно підвищити ймовірність того, що ви виграєте наступні 35 ігор.
Примітка на основі нових даних
На основі ваших даних для 18 ігор я спробував підлаштувати бета-біноміальну модель. Варіація та та обчислення ймовірностей потрапити на бал i, 21 (через i, 20) або бал 20,20, а потім підсумовувати свої журнали до оцінка вірогідності журналу.α=μνβ=(1−μ)ν
Це показує, що дуже високий параметр (невелика дисперсія в базовому бета-розподілі) має більш високу ймовірність, і, отже, малоенергетична дисперсія. Це означає, що дані не підказують, що для використання ймовірності виграти очко краще використовувати змінний параметр, а не 58% шансів на перемогу. Ці нові дані забезпечують додаткову підтримку аналізу Вюбера, який передбачає бали на основі біноміального розподілу. Але, звичайно, це все ж передбачає, що модель є статичною, а також, що ви та ваш колега поводитесь за випадковою моделлю (в якій кожна гра та точка незалежні).ν
Максимальна оцінка ймовірності параметрів бета-розподілу замість фіксованого 58% виграшного шансу:
Питання: як я читаю графік "LogLikelihood для параметрів mu і nu"?
A:
- 1) Максимальна оцінка ймовірності (MLE) - це спосіб підходити до моделі. Імовірність означає ймовірність даних, заданих параметрами моделі, і тоді ми шукаємо модель, яка це максимально збільшує. За цим стоїть багато філософії та математики.
- 2) Сюжет - це ледачий обчислювальний метод, щоб дістатись до оптимального MLE. Я просто обчислюю всі можливі значення в сітці і бачу, що таке valeu. Якщо вам потрібно бути швидшим, ви можете скористатися обчислювальним ітеративним методом / алгоритмом, який шукає оптимальну, або, можливо, може бути пряме аналітичне рішення.
- 3) Параметри та відносяться до бета-розподілу https://en.wikipedia.org/wiki/Beta_distribution, який використовується як модель для p = 0,58 (щоб зробити його не фіксованим, а натомість змінюватись в залежності від часу час). Цей модельований "бета-р" поєднується з біноміальною моделлю, щоб дійти до передбачень ймовірності досягнення певних показників. Це майже те саме, що і бета-біноміальний розподіл. Ви можете бачити, що оптимум становить приблизно що не дивно. Значення висока (означає низьку дисперсію). Я уявляв / очікував хоч якусь перевитрату.ν μ ≃ 0,6 νμνμ≃0.6ν
код / обчислення для графіку 1
posterior <- sapply(seq(1,5,0.1), function(x) {
integrate(function(p) dbeta(p,x,x)*p^50,0,1)[1]$value/
integrate(function(p) dbeta(p,x,x)*p^15,0,1)[1]$value
}
)
prior <- sapply(seq(1,5,0.1), function(x) {
integrate(function(p) dbeta(p,x,x)*p^35,0,1)[1]$value
}
)
layout(t(c(1,2)))
plot( seq(1,5,0.1), posterior,
ylim = c(0,0.32),
xlab = expression(paste(alpha, " and ", beta ," values for prior beta-distribution")),
ylab = "P(win another 35| after already 15)"
)
title("posterior probability assuming beta-distribution")
plot( seq(1,5,0.1), prior,
ylim = c(0,0.32),
xlab = expression(paste(alpha, " and ", beta ," values for prior beta-distribution")),
ylab = "P(win 35)"
)
title("prior probability assuming beta-distribution")
код / обчислення для графи 2
library("shape")
# probability that you win and opponent has kl points
Pwl <- function(a,b,kl,kw=21) {
kt <- kl+kw-1
Pwl <- choose(kt,kw-1) * beta(kw+a,kl+b)/beta(a,b)
Pwl
}
# probability to end in the 20-20 score
Pww <- function(a,b,kl=20,kw=20) {
kt <- kl+kw
Pww <- choose(kt,kw) * beta(kw+a,kl+b)/beta(a,b)
Pww
}
# probability that you lin with kw points
Plw <- function(a,b,kl=21,kw) {
kt <- kl+kw-1
Plw <- choose(kt,kw) * beta(kw+a,kl+b)/beta(a,b)
Plw
}
# calculation of log likelihood for data consisting of 17 opponent scores and 1 tie-position
# parametezation change from mu (mean) and nu to a and b
loglike <- function(mu,nu) {
a <- mu*nu
b <- (1-mu)*nu
scores <- c(18, 17, 11, 13, 15, 15, 16, 9, 17, 17, 13, 8, 17, 11, 17, 13, 19)
ps <- sapply(scores, function(x) log(Pwl(a,b,x)))
loglike <- sum(ps,log(Pww(a,b)))
loglike
}
#vectors and matrices for plotting contour
mu <- c(1:199)/200
nu <- 2^(c(0:400)/40)
z <- matrix(rep(0,length(nu)*length(mu)),length(mu))
for (i in 1:length(mu)) {
for(j in 1:length(nu)) {
z[i,j] <- loglike(mu[i],nu[j])
}
}
#plotting
levs <- c(-900,-800,-700,-600,-500,-400,-300,-200,-100,-90,-80,-70,-60,-55,-52.5,-50,-47.5)
# contour plot
filled.contour(mu,log(nu),z,
xlab="mu",ylab="log(nu)",
#levels=c(-500,-400,-300,-200,-100,-10:-1),
color.palette=function(n) {hsv(c(seq(0.15,0.7,length.out=n),0),
c(seq(0.7,0.2,length.out=n),0),
c(seq(1,0.7,length.out=n),0.9))},
levels=levs,
plot.axes= c({
contour(mu,log(nu),z,add=1, levels=levs)
title("loglikelihood for parameters mu and nu")
axis(1)
axis(2)
},""),
xlim=range(mu)+c(-0.05,0.05),
ylim=range(log(nu))+c(-0.05,0.05)
)