Основна відмінність між інтерполяцією та регресією - це визначення проблеми, яку вони вирішують.
Враховуючи точок даних, під час інтерполяції ви шукаєте функцію, яка має певну заздалегідь форму, яка має значення в цих точках точно так, як зазначено. Це означає, що для заданих пар ( x i , y i ) ви шукаєте F деякої заздалегідь визначеної форми, яка задовольняє F ( x i ) = y i . Я думаю, що найчастіше F вибирають як многочлен, сплайн (поліноми низького ступеня на інтервалах між заданими точками).n(xi,yi)FF(xi)=yiF
Під час регресії ви шукаєте функцію, яка мінімізує деяку вартість, як правило, суму квадратів помилок. Вам не потрібно, щоб функція мала точні значення в заданих точках, ви просто хочете гарної апроксимації. Взагалі знайдена функція може не задовольняти F ( x i ) = y i для будь-якої точки даних, але функція витрат, тобто ∑ n i = 1 ( F ( x i ) - y i ) 2, буде найменшою можливою всіх функцій заданої форми.FF(xi)=yi∑ni=1(F(xi)−yi)2
Хороший приклад того, чому ви хочете лише приблизно оцінити замість інтерполяції, - це ціни на фондовому ринку. Ви можете взяти ціни за кілька останніх одиниць часу і спробувати інтерполювати їх, щоб отримати деякий прогноз ціни в наступній одиниці часу. Це досить погана ідея, тому що немає підстав думати, що відносини між цінами можуть бути точно виражені поліном. Але лінійна регресія може зробити трюк, оскільки ціни можуть мати певний "нахил", а лінійна функція може бути хорошим прискоренням, принаймні локально (натяк: це не так просто, але регресія, безумовно, краща ідея, ніж інтерполяція в цьому випадку ).k