Як інтерполяція пов'язана з поняттям регресії?


17

Поясніть коротко, що розуміється під інтерполяцією. Як це пов'язано з поняттям регресії?

інтерполяція - це мистецтво читання між рядками таблиці, а в елементарній математиці термін зазвичай позначає процес обчислення проміжних значень функції з набору заданих або табличних значень цієї функції.

Я не можу дати відповідь на друге запитання. Будь ласка, допоможіть


4
Регресія має на меті визначити функцію для опису очікуваного значення Y (залежної змінної), заданого X (незалежні змінні). Інтерполяція використовує регресію для прогнозування значення Y при заданих значеннях X . Різниця є тонким, але виходить на перший план у моделях, де Y співвідносяться, оскільки тоді прогнозовані значення зазвичай відрізняються від їх регресійних значень. Ні регресія, ні прогнозування не застосовуються безпосередньо до інтерполяції в математичних таблицях, які, як правило, вважають, що не мають випадкових помилок, але їхні алгоритми все ж можна використовувати.
whuber

2
Це робота для якогось класу?
Glen_b -Встановити Моніку

Відповіді:


23

Основна відмінність між інтерполяцією та регресією - це визначення проблеми, яку вони вирішують.

Враховуючи точок даних, під час інтерполяції ви шукаєте функцію, яка має певну заздалегідь форму, яка має значення в цих точках точно так, як зазначено. Це означає, що для заданих пар ( x i , y i ) ви шукаєте F деякої заздалегідь визначеної форми, яка задовольняє F ( x i ) = y i . Я думаю, що найчастіше F вибирають як многочлен, сплайн (поліноми низького ступеня на інтервалах між заданими точками).n(xi,yi)FF(xi)=yiF

Під час регресії ви шукаєте функцію, яка мінімізує деяку вартість, як правило, суму квадратів помилок. Вам не потрібно, щоб функція мала точні значення в заданих точках, ви просто хочете гарної апроксимації. Взагалі знайдена функція може не задовольняти F ( x i ) = y i для будь-якої точки даних, але функція витрат, тобто n i = 1 ( F ( x i ) - y i ) 2, буде найменшою можливою всіх функцій заданої форми.FF(xi)=yii=1n(F(xi)yi)2

Хороший приклад того, чому ви хочете лише приблизно оцінити замість інтерполяції, - це ціни на фондовому ринку. Ви можете взяти ціни за кілька останніх одиниць часу і спробувати інтерполювати їх, щоб отримати деякий прогноз ціни в наступній одиниці часу. Це досить погана ідея, тому що немає підстав думати, що відносини між цінами можуть бути точно виражені поліном. Але лінійна регресія може зробити трюк, оскільки ціни можуть мати певний "нахил", а лінійна функція може бути хорошим прискоренням, принаймні локально (натяк: це не так просто, але регресія, безумовно, краща ідея, ніж інтерполяція в цьому випадку ).k


Гарна відповідь. Я додам, що з регресією стоїть статистична модель, яка визначає співвідношення між і X з точки зору деякого розподілу, де ми оцінюємо його середнє значення (або медіану, або квантили тощо в різних ароматах регресії), наприклад статистику .stackexchange.com / questions / 173660 /…YX
Тім

Чи не був би описаний вами приклад екстраполяцією, а не інтерполяцією?
bi_scholar

6

Два попередні відповіді пояснили зв'язок між лінійною інтерполяцією та лінійною регресією (або навіть загальною інтерполяцією та поліноміальною регресією). Але важливим зв’язком є ​​те, що після встановлення регресійної моделі ви можете використовувати її для інтерполяції між даними точками даних.


Тож коли я регресую, скажімо, зріст проти статі, я можу інтерполювати, щоб знайти очікуваний зріст напів-чоловіка, напів-жінки! Цей химерний приклад підкреслює основний недолік у цій відповіді, який є припущенням, що всі регресори в регресійній моделі повинні бути безперервними змінними.
whuber

2
Моя відповідь застосовується, коли всі змінні прогнозувальника безперервні ..
Майкл Р. Черник

4

Сподіваємось, це стане досить швидко простим прикладом та візуалізацією.

Припустимо, у вас є такі дані:

X  Y
1  6
10 15
20 25
30 35
40 45
50 55

Ми можемо використовувати регресію для моделювання Y як відповідь на X. Використання R: lm(y ~ x)

Результати - це перехоплення 5, а коефіцієнт x для 1. Що означає, що довільний Y можна обчислити для даного X як X + 5. Як малюнок, ви можете бачити це так:

введіть тут опис зображення

Зверніть увагу, як якщо ви перейшли до осі X, будь-де вздовж неї, і намалювали лінію до встановленої лінії, а потім намалювали лінію до осі Y, ви можете отримати значення, незалежно від того, я надав точку значення для Y. Регресія згладжується над областями, у яких відсутні дані, шляхом оцінки базового співвідношення.


2

основна різниця b / w Інтерполяція та регресія полягає в наступному: Інтерполяція: припустимо, є n точок (наприклад: 10 точок даних), в інтерполяції ми помістимо криву, що проходить через усі точки даних (тобто тут 10 точок даних) з a ступінь многочлена (немає точок даних -1; тобто тут це 9).

як правило, порядок інтерполяції та регресії буде (1,2 або 3), якщо порядок більше 3, більше коливань буде видно в кривій.


2
Це означає, що інтерполяція базується на поліномах, але є кілька інших методів, такі як кубічний сплайн, кусочний кубічний ерміт, найближчий сусід тощо.
Нік Кокс

@Nick Хоча ви маєте рацію, цікаво, що кожен метод, який ви називаєте, насправді базується на поліномах! Мабуть, найпростіший, найвідоміший неполіномічний інтерполятор - зважування на зворотному відстані (ІДВ).
whuber

@whuber Погодився; якщо поліноми можна застосовувати з обмеженнями, то більшість методів кваліфікуються, наприклад, найближчий сусід = кусочна константа тощо.
Нік Кокс

2

Регресія - це процес знаходження лінії, що найкраще підходить [1]. Інтерполяція - це процес використання лінії, що найкраще підходить для оцінки значення однієї змінної від значення іншої, за умови, що значення, яке ви використовуєте, знаходиться в межах ваших даних. Якщо це буде поза межами діапазону, ви б використовували Екстраполяцію [1].

[1] http://mathhelpforum.com/advanced-applied-math/182558-interpolation-vs-regression.html


2
Ця відповідь не відрізняє інтерполяцію від екстраполяції. Ти вважаєш, що вони однакові? До речі, форуми з математики (і навіть підручники та статті), як правило, не є хорошими джерелами інформації про статистичні питання, тому що вони, як правило, зосереджені на вузьких математичних значеннях, які - хоча правильні і корисні в чисто математичних програмах - можуть не застосовуватися ширше. .
качан

1

При отриманні інтерполяції чи сплайну, ми отримуємо числові дані (інтерпольована ставка, що перебувають у кожній парі оригінальних даних) більшого розміру, які при побудові графіку створюють ефект плавної кривої. Насправді між кожною парою оригінальних даних встановлений різний многочлен, тому вся крива після інтерполяції - це безперервна безперервна крива, де кожен шматок складається з різного многочлена.

Якщо ви шукаєте параметричне подання вихідних числових даних, необхідно здійснити регресію. Ви також можете спробувати прилаштувати поліном високого ступеня до сплайна. У будь-якому випадку представлення буде наближенням. Ви також можете перевірити, наскільки точне наближення.


Здається, у вас ще не було можливості прочитати коментар Ніка Кокса , який вказує, що не всі інтерполятори є (локальними) поліномами.
whuber

0

І регресія, і інтерполяція використовуються для прогнозування значень змінної (Y) для заданого значення іншої змінної (X). В Регресії ми можемо передбачити будь-яке значення залежної змінної (Y) для заданого значення незалежної змінної (X) Навіть якщо воно не виходить за межі табличних значень. Але в разі інтерполяції ми можемо передбачити значення залежної змінної (Y) для значення незалежної змінної (X), яка знаходиться в межах заданих значень X.


0

Інтерполяція - це процес пристосування ряду точок між x = a і x = b точно до інтерполяційного многочлена. Інтерполяція може бути використана для пошуку приблизного значення (або відсутнього значення) y в області x = [a, b] з кращою точністю, ніж методика регресії.

З іншого боку, регресія - це процес прилаштування ряду точок до кривої, яка проходить через точки зору або поблизу з мінімальною помилкою квадрата. Регресія не буде наближати значення y в області x = [a, b] настільки точним, як інтерполяція, однак регресія забезпечує кращі прогнози, ніж інтерполяція для значень y в області між x = (- нескінченність, a) і x = ( b, + нескінченність).

Підсумовуючи це, інтерполяція забезпечує кращу точність значення у межах домену відомого діапазону x, тоді як регресія забезпечує кращі прогнози y у домені нижче та поза відомим діапазоном x.


3
Не є визначенням інтерполяції, що використовується многочлен. Інші плавні функції можуть бути доречними.
Нік Кокс

3
З вашими претензіями є й інші проблеми. Наприклад, регресія може бути точнішою, ніж інтерполяція. Статистичне розмежування двох процедур сильно відрізняється від того, що ви представляєте: будь ласка, дивіться інші публікації в цій темі.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.