Давши точок даних ( x i , y i ) , i = 1 , 2 , ... n , в площині проведемо пряму
y = a x + b . Якщо ми передбачаємо а х я + Ь в якості значення у я з г я , то помилка є ( у я - у я ) = ( уn(xi,yi),i=1,2,…ny=ax+baxi+by^iyi , токвадрат помилкиє
( у я - х я - б ) 2 , азагальна квадрат помилки Σ п я = 1 ( у я - х я - б ) 2 . Просимо(yi−y^i)=(yi−axi−b)(yi−axi−b)2 ∑ni=1(yi−axi−b)2
Який вибір і b мінімізує
S = n ∑ i = 1 ( y i - a x i - b ) 2 ?abS=∑i=1n(yi−axi−b)2
Оскільки - вертикальна відстань ( x i , y i ) від прямої, ми запитуємо пряму так, щоб сума квадратів вертикальних відстаней точок від лінія якомога менша. Тепер S - квадратична функція і a, і b і досягає свого мінімального значення, коли a і b такі, що
∂ S(yi−axi−b)(xi,yi)Sabab
З другого рівняння отримаємо
b=1
∂S∂a∂S∂b=2∑i=1n(yi−axi−b)(−xi)=2∑i=1n(yi−axi−b)(−1)=0=0
де
μy=1b=1n∑i=1n(yi−axi)=μy−aμx
- середні арифметичні значення
yi's та
xi' s відповідно. Підставляючи перше рівняння, отримуємо
a=( 1μy=1n∑i=1nyi, μx=1n∑i=1nxiyixi
Таким чином, пряму, яка мінімізує
S,можна виразити як
y=ax+b=μy+((1a=(1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x.
Sy=ax+b=μy+((1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x)(x−μx),
SSmin=[(1n∑ni=1y2i)−μ2y][(1n∑ni=1x2i)−μ2x]−[(1n∑ni=1xiyi)−μxμy]2(1n∑ni=1x2i)−μ2x.
Якщо ми обмінюємося ролями і , проведемо лінію
і запитаємо значення
і які мінімізують
тобто ми хочемо, щоб лінія була такою, що сума квадратів горизонтальних відстаней точок від лінія якомога менша, тоді ми отримуємоу й = у + б а б Т = п Σ я = 1 ( х я - у я - б ) 2 ,xyx=a^y+b^a^b^
T=∑i=1n(xi−a^yi−b^)2,
TTmin=[(1
x=a^y+b^=μx+((1n∑ni=1xiyi)−μxμy(1n∑ni=1y2i)−μ2y)(y−μy)
і мінімальне значення -
TTmin=[(1n∑ni=1y2i)−μ2y][(1n∑ni=1x2i)−μ2x]−[(1n∑ni=1xiyi)−μxμy]2(1n∑ni=1y2i)−μ2y.
Зауважте, що обидві лінії проходять через точку
але схили
в цілому різні. Дійсно, як в коментарі вказує @whuber, нахили однакові, коли всі точки лежать на одній прямій. Щоб побачити це, зауважте, що
(μx,μy)
a=(1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x, a^−1=(1n∑ni=1y2i)−μ2y(1n∑ni=1xiyi)−μxμy
(xi,yi)a^−1−a=Smin(1n∑ni=1xiyi)−μxμy=0⇒Smin=0⇒yi=axi+b,i=1,2,…,n.