Підсумок моєї відповіді. Мені подобається моделювання ланцюгів Маркова, але воно пропускає "часовий" аспект. З іншого боку, зосередження уваги на часовому аспекті (наприклад, середній час в ) не вистачає аспекту "переходу". Я б перейшов до наступного загального моделювання (яке при належному припущенні може призвести до [марківського процесу] [1]). Також існує багато "цензурованої" статистики за цією проблемою (що, безумовно, є класичною проблемою надійності ПЗ?). Останнє рівняння моєї відповіді дає максимальну оцінку ймовірності інтенсивності голосування (на «+» та вниз «-») для даного стану голосування. Як ми бачимо з рівняння, це проміжний випадок від випадку, коли ви оцінюєте лише ймовірність переходу, і випадку, коли ви вимірюєте лише час, проведений у заданому стані. Сподіваюся, що це допоможе.−1
Загальне моделювання (для перегляду питання та припущень).
Нехай і є випадковими змінними, що моделюють відповідно дати голосування та пов’язаний з ними знак голосування (+1 за підсумковий результат, -1 - за нижчу оцінку). Процес голосування просто(VDi)i≥1(Si)i≥1
Yt=Y+t−Y−t
де
Y+t=∑i=0∞1VDi≤t,Si=1 and Y−t=∑i=0∞1VDi≤t,Si=−1
Важливою величиною тут є інтенсивність -jump
де може бути або і - це хороша фільтрація, в іншому випадку без інших знань було б :
.ϵ
λϵt=limdt→01dtP(Yϵt+dt−Yϵt=1|Ft)
ϵ−+FtFt=σ(Y+t,Y−t,VD1,…,VDY+t+Y−t,S1,…,SY+t+Y−t)
але по лінії вашого запитання, я думаю, ви неявно припускаєте, що
Це означає, що для існує детермінована послідовність такий, що .
P(Yϵt+dt−Yϵt=1|Ft)=P(Yϵt+dt−Yϵt=1|Yt)
ϵ=+,−(μϵi)i∈Zλϵt=μϵYt
У цьому формалізмі ви можете пересвідчитись як: "ймовірно, що " (або, принаймні, різниця більша за заданий поріг).μ+−1−μ+0>0
Згідно з цим припущенням, легко показати, що - це [однорідний марківський процес] [3] на з генератором заданимYtZQ
∀i,j∈ZQi,i+1=μ+iQi,i−1=μ−iQii=1−(μ+i+μ−i)Qij=0 if |i−j|>1
Відповідь на питання (пропонуючи максимальну оцінку ймовірності статистичної задачі).
З цього переформулювання вирішення задачі здійснюється шляхом оцінки та побудови тесту на її значення. Давайте виправимо та забудемо індекс без втрати загальності. Оцінка (і ) може здійснюватися після спостереження за(μ+i)iμ+μ−
(T1,η1),…,(Tp,ηp) , де є довжини таких періодів , проведених в стані (тобто послідовні часи з ) і - якщо питання було схвалено, якщо воно було зняте, і якщо це був останній стан спостереження.TjjthpiYt=iηj+1−10
Якщо ви забудете випадок із останнім станом спостереження, згадані пари є ідентифікатором від розподілу, який залежить від та : він розподіляється як (де Exp є випадковим var із експоненціального розподілу і дорівнює + або -1 залежно від того, хто реалізує макс.) Тоді ви можете використовувати таку просту лему (доказ прямо):μ+iμ−i(min(Exp(μ+i),Exp(μ−i)),η)η
Лемма Якщо і то і . X+⇝Exp(μ+)X−⇝Exp(μ−)T=min(X+,X−)⇝Exp(μ++μ−)P(X+1<X−)=μ+μ++μ−
Це означає , що щільність з визначається за формулою:
де для - функція щільності експоненціальної випадкової величини з параметром . З цього виразу легко вивести оцінку максимальної ймовірності та :f(t,ϵ)(T,η)
f(t,ϵ)=gμ++μ−(1(ϵ=+1)∗μ++1(ϵ=−1)∗μ−μ++μ−)
gaa>0aμ+μ−
(μ^+,μ^−)=argminln(μ−+μ+)((μ−+μ+)∑i=1pTi+p)−p−ln(μ−)−p+ln(μ+)
деі.
p−=|i:δi=−1|p+=|i:δi=+1|
Коментарі для більш вдосконалених підходів
Якщо ви хочете взяти до уваги випадки, коли - останній спостережуваний стан (звичайно розумніший, бо коли ви проходите , це часто ваш останній бал ...), вам доведеться трохи змінити міркування. Відповідна цензура є відносно класичною ...i−1
Можливий інший підхід може включати можливість
- Маючи інтенсивність, яка зменшується з часом
- Маючи інтенсивність, яка зменшується з часом, проведеним з моменту останнього голосування (я віддаю перевагу цьому. У цьому випадку є класичний спосіб моделювання того, як щільність зменшується ...
- Ви можете припустити, що - це гладка функціяμ+ii
- .... ви можете запропонувати інші ідеї!