Коротка відповідь
Щільність ймовірності багатоваріантної розподіленої гауссової змінної , із середнім пов'язана з квадратом евклідового відстань між середнім значенням та змінною ( ), або іншими словами сума квадратів.x=(x1,x2,...,xn)μ=(μ1,μ2,...,μn)|μ−x|22
Довга відповідь
Якщо ви помножите кілька гауссових розподілів на свої помилок, де ви припускаєте рівні відхилення, то ви отримаєте суму квадратів.n
L(μj,xij)=P(xij|μj)=∏ni=112πσ2√exp[−(xij−μi)22σ2]=(12πσ2√)nexp[−∑ni=1(xij−μi)22σ2]
або у зручній логарифмічній формі:
log(L(μj,xij))=nlog(12πσ2−−−−√)−12σ2∑i=1n(xij−μj)2
Таким чином, оптимізація для мінімізації суми квадратів дорівнює максимізації ймовірності (log) (тобто добутку множинних гауссових розподілів або багатоваріантного розподілу Гаусса).μ
Саме цей вкладений квадрат різниці всередині експоненціальної структури, , якого інші розподіли не мають.(μ−x)exp[(xi−μ)2]
Порівняйте, наприклад, з випадком розподілу Пуассона
log(L)=log(∏μxijjxij!exp[−μj])=−∑μj−∑log(xij!)+∑log(μj)xij
який має максимум, коли мінімізується наступне:
∑μj−log(μj)xij
який є іншим звіром.
Крім того (історія)
Історія нормального розподілу (ігнорування діМоївре потрапляння до цього розподілу як наближення до біноміального розподілу) насправді є відкриттям розподілу, завдяки якому MLE відповідає методу найменших квадратів (а не методу найменших квадратів, як методу які можуть виражати MLE нормального розподілу, перший прийшов метод найменших квадратів, другий прийшов розподіл Гаусса)
Зауважимо, що Гаусс, пов'язуючи "метод максимальної ймовірності" з "методом найменших квадратів", придумав "розподіл Гаусса", , як єдиний розподіл помилок, що призводить нас до зробити цей зв'язок між двома методами.e−x2
З перекладу Чарльза Генрі Девіса (Теорія руху небесних тіл, що рухаються навколо Сонця в конічних розділах. Переклад Гауса "Теорія мотива" з додатком) ...
Гаус визначає:
Відповідно, ймовірність присвоїти кожній помилці буде виражена функцією яку позначимо через .ΔΔψΔ
(Італія зроблена мною)
І продовжується ( у розділі 177 с. 258 ):
... звідки легко зробити висновок, що має бути постійною величиною. яку позначимо через . Отже, у нас є позначає основу гіперболічних логарифмів і припускаючиψ′ΔΔklog ψΔ=12kΔΔ+Constant
ψΔ=xe12kΔΔ
eConstant=logx
закінчення (після нормалізації та реалізації ) вk<0
ψΔ=hπ−−√e−hhΔΔ
Автор StackExchangeStrike