Щоб розширити свій коментар - це залежить. Якщо ви лише намагаєтесь зрозуміти основи, то, якщо ви зможете знайти екстремальність функцій, ви отримаєте справедливий шлях (хоча у багатьох практичних випадках MLE, ймовірність максимально збільшується, і в цьому випадку вам потрібні інші навички, а також деякі основне числення).
Я залишу осторонь приємні прості випадки, коли ви отримуєте явні алгебраїчні рішення. Незважаючи на це, обчислення часто дуже корисне.
Я візьму на себе незалежність протягом усього часу. Візьмемо найпростіший можливий випадок оптимізації з 1 параметром. Спочатку ми розглянемо випадок, коли ми можемо взяти похідні та відокремити функцію параметра та статистику.
Розглянемо щільність G a m m a (α,1)
fХ( x ; α ) = 1Γ ( α )хα - 1досвід( - х ) ;x > 0 ;α > 0
Тоді для вибірки розміру н ймовірність така
L (α; x )= ∏i = 1нfХ( хi; α )
і тому ймовірність журналу дорівнює
l (α; x )= ∑i = 1нlnfХ( хi; α )= ∑i = 1нln( 1Γ ( α )хα - 1iдосвід( - хi) )
= ∑i = 1н- лнΓ ( α ) +(α-1)lnхi- хi
= - n lnΓ ( α ) +(α-1) Sх- n x¯
деSх= ∑нi = 1lnхi . Беручи похідні,
ггαl (α; x )= dгα( - n lnΓ ( α ) +(α-1) Sх- n x¯)
= - n Γ'( α )Γ ( α )+ Sх
= - n ψ ( α ) + Sх
Так що, якщо ми встановлюємо , що до нуля і спробувати вирішити для альфа , ми можемо отримати цю:
ψ ( α ) = LN G ( х )α^ψ ( α^) = lnG ( x )
ψ ( ⋅ )G ( ⋅ )
α^
ψ ( α^) = g
г= lnG ( x )
Це не має рішення з точки зору елементарних функцій, воно повинно обчислюватися чисельно; принаймні, нам вдалося отримати функцію параметра з одного боку та функцію даних з іншого. Існують різні алгоритми знаходження нуля, які можуть бути використані, якщо у вас немає явного способу вирішення рівняння (навіть якщо ви не маєте похідних, наприклад, є бінарний розділ).
f( x ; μ ) = 14січ2( x - μ2) .
мк
θ
fХ( x ; θ ) = 1π( 1 + ( х - θ )2).
Загалом вірогідність тут не має унікального локального максимуму, а декількох локальних максимумів. Якщо ви виявили на локальний максимум, може бути інший, більше одного в іншому місці. (Іноді люди зосереджуються на визначенні локального максимуму, найближчого до медіани, або якогось такого.)
( 0 , θ )
В інших випадках простір параметрів може бути дискретним.
Іноді пошук максимуму може бути дуже причетним.
І це лише вибірка проблем з одним параметром. Коли у вас є кілька параметрів, речі знову активізуються.