Екстраполяція v. Інтерполяція


28

Яка різниця між екстраполяцією та інтерполяцією та яким є найточніший спосіб використання цих термінів?

Наприклад, я бачив твердження в роботі, використовуючи інтерполяцію, як:

"Процедура інтерполює форму оціночної функції між точками бін"

Речення, яке використовує як екстраполяцію, так і інтерполяцію, наприклад:

Попередній крок, де ми екстраполювали інтерпольовану функцію за допомогою методу Kernel на лівий і правий хвости температури.

Чи може хтось надати чіткий та простий спосіб їх розрізнити та вказати, як правильно використовувати ці терміни на прикладі?




@ usεr11852 Я думаю, що два питання охоплюють аналогічну основу, але різні, тому що це запитує контраст з інтерполяцією.
mkt - Відновіть Моніку

Чи було чітко формалізовано це розмежування між інтерполяцією та екстраполяцією загально узгодженим способом (наприклад, за допомогою опуклих корпусів) чи ці терміни все ще підлягають людському судження та інтерпретації?
Нік Алгер

Відповіді:


51

Щоб додати візуальне пояснення до цього: розглянемо кілька моментів, які ви плануєте моделювати.

введіть тут опис зображення

Вони схожі на те, що їх можна було б добре описати прямою лінією, тому ви підходите до лінійної регресії до них:

введіть тут опис зображення

Ця лінія регресії дозволяє як інтерполювати (генерувати очікувані значення між точками даних), так і екстраполювати (генерувати очікувані значення за межами діапазону точок даних). Я виділив екстраполяцію червоним кольором і найбільшу область інтерполяції синім кольором. Щоб було зрозуміло, навіть крихітні регіони між точками є інтерпольованими, але тут я лише виділяю велике.

введіть тут опис зображення

Чому екстраполяція взагалі викликає занепокоєння? Тому що ви зазвичай набагато менш впевнені у формі взаємозв'язку поза діапазоном даних. Поміркуйте, що може статися, коли ви збираєте ще кілька точок даних (порожніх кіл):

введіть тут опис зображення

Виявляється, зрештою, стосунки не були добре узгоджені з вашими гіпотезованими відносинами. Прогнози в екстрапольованій області не вдається. Навіть якщо ви здогадалися про точну функцію, яка правильно описує це нелінійне співвідношення, ваші дані не поширюються на достатній діапазон, щоб добре засвоїти нелінійність, тож, можливо, ви все ще були досить далеко. Зауважте, що це проблема не лише для лінійної регресії, а для будь-яких взаємин - саме тому екстраполяція вважається небезпечною.

Прогнози в інтерпольованій області також є невірними через відсутність нелінійності придатності, але їх похибка прогнозування значно нижча. Немає гарантії, що у вас не виникне несподіване відношення між точками (тобто область інтерполяції), але це, як правило, менш вірогідно.


Додам, що екстраполяція - це не завжди страшна ідея - якщо ви екстраполюєте крихітний шматочок поза діапазоном своїх даних, ви, мабуть, не дуже помилитесь (хоча це можливо!). Древні, які не мали гарної наукової моделі світу, не помилилися б, якби прогнозували, що Сонце знову встане на наступний день і на наступний день (хоча одного дня далеко в майбутнє, навіть це не вийде).

2

Редагувати на основі коментарів: будь то інтерполяція чи екстраполяція, завжди краще мати якусь теорію, щоб обґрунтувати очікування. Якщо теорія вільного моделювання повинно бути зроблено, ризик від інтерполяції зазвичай менше , ніж екстраполяція. Однак, оскільки розрив між точками даних збільшується в масштабі, інтерполяція також все більше загрожує ризиком.


5
Мені подобається ваша відповідь, і вважаю це доповненням до моєї і в жодному сенсі не змагається. Але невеликий момент, важливий для деяких читачів, полягає в тому, що червоний і зелений досить важко виділити візуально.
Нік Кокс

1
@NickCox Добре, дякую за те, що ви зробили це - я тепер змінив колірну гаму.
mkt - Відновіть Моніку

1
@leftaroundabout Моя думка полягала в тому, що схема кривої Кілінга настільки сильна, що екстраполяції, що ігнорують економіку та фізику, все ще досить точні в масштабі років до кількох десятиліть. Я зазначив "останні кілька десятиліть" саме тому, що це часова шкала, в якій ми проводили вимірювання з високою роздільною здатністю. Це приклад, коли екстраполяція не призвела б до ваших помилок, і я думаю, що це варто зазначити. Я думаю, що буде потрібно навмисне неправильне прочитання, щоб стверджувати, що ця відповідь виступає за екстраполяцію, що не має теорії.
mkt - Відновіть Моніку

1
Так само я дав у цій відповіді "приклад індички" Талеба як попередження для людей, які використовують екстраполяцію.
Дж. М. не є статистиком

1
Екстраполяція особливо проблематична, коли у вас є надмірне обладнання; Наприклад, з поліноміальною моделлю, значне виходження за межі набору даних призведе до вибуху найвищого порядку.
Накопичення

21

По суті інтерполяція - це операція в межах підтримки даних або між існуючими відомими точками даних; екстраполяція виходить за межі підтримки даних . В іншому випадку критерієм є: де відсутні значення?

Однією з причин розрізнення є те, що екстраполяцію, як правило, важче зробити добре, і навіть небезпечно, статистично, якщо не практично. Це не завжди вірно: наприклад, річкові повені можуть перекрити засоби вимірювання скиду або навіть ступінь (вертикальний рівень), вирвавши дірку в вимірюваному записі. За таких обставин інтерполяція розряду чи стадії теж є складною, а знаходження в службі підтримки даних не дуже допомагає.

Зрештою, якісні зміни зазвичай витісняють кількісні зміни. Близько 1900 р. Було багато занепокоєння, що зростання потягування коней змолотить міста з переважно небажаними екскрементами. Експоненцію екскрементів витіснила двигун внутрішнього згоряння та різні його експоненти.

Тенденція - тенденція, тренд,
Але питання полягає в тому, чи згине він?
Чи змінить його хід
через якусь непередбачену силу
І прийде до передчасного кінця?

- Олександр Кернкросс

Кернкросс, А. 1969. Економічне прогнозування. Економічний журнал , 79: 797-812. doi: 10.2307 / 2229792 (цитата на с.797)


1
Гарна відповідь. Інтерпретація є саме в назві - інтерполяція = згладити всередині, екстраполяція = згладити поза.
Ядерна Ванга

1
ІМО це правильна відповідь. "Підтримка даних" є найважливішим бітом; навіть якщо точка, яку ви хочете пройти, знаходиться між двома виміряними, вона все одно може лежати поза підтримкою даних. Наприклад, якщо у вас є дані про добробут людей у ​​римській античності та від сучасності, але не між ними, то інтерполяція в середні віки була б дуже проблематичною. Я б назвав це екстраполяцією. ОТОХ, якщо у вас є дані, розповсюджені рідко, але рівномірно через весь проміжок часу, то інтерполяція на певний рік набагато правдоподібніша.
близько

1
@leftaroundabout Просто через те, що інтерполяція може бути здійснена через величезний пробіл у даних, це не робить її екстраполяцією. Ви помиляєтесь з доцільністю процедури для самої процедури. Іноді інтерполяція теж погана ідея.
mkt - Відновіть Моніку

1
@mkt: Я збираюся осторонь того, що його перший приклад можна вважати екстраполяцією, оскільки інтерполяція проти екстраполяції насправді не так чітко визначена, як ми можемо подумати. Просте перетворення змінних може перетворити інтерполяцію в екстраполяцію. У його прикладі використання щось на зразок дистанційних функцій замість необробленого часу означає, що в той час, коли в сирий час ми інтерполюємо, на відстані ми екстраполюємось ... і використання сирих часів, мабуть, буде поганою ідеєю.
Кліф АВ

1
Це моя відповідь. Я не відчуваю потреби в цьому. Широка відмінність між інтерполяцією та екстраполяцією не виключає того, що визначити, що саме робиться, небагато складно. Якщо у вас є велика діра посередині простору даних, маркування може піти в будь-який бік. Як зазначали деякі ваги, той факт, що кінець дня і початок ночі розмиваються один з одним, не робить розрізнення дня і ночі безглуздим або марним.
Нік Кокс

12

Версія TL; DR:

  • Inter Поляціте має місце між існуючими точками даних.
  • Додаткове полягання відбувається поза ними.

Мнемонічний: в терполяції => в сторону.

FWIW: Префікс означає між і додаткові засоби . Подумайте також про міждержавні шосе, які йдуть між державами, або зайві наземні території за межами нашої планети.


1

Приклад:

Дослідження: Хочете встановити просту лінійну регресію по зростанню за віком для дівчат віком 6-15 років. Розмір зразка - 100, вік обчислюється (дата вимірювання - дата народження) /365,25.

Після збору даних модель підходить і отримують оцінку перехоплення b0 та нахилу b1. це означає, що ми маємо E (зріст | вік) = b0 + b1 * вік.

Коли ви хочете, щоб середній зріст був для 13 років, ви виявите, що у вашій вибірці з 100 дівчат немає 13-річної дівчинки, одній з них 12,83 року, а одній 13,24.

Тепер ви додаєте вік = 13 до формули E (зріст | вік) = b0 + b1 * вік. Це називається інтерполяцією, оскільки 13-річна охоплена діапазоном ваших даних, які використовуються для відповідності моделі.

Якщо ви хочете отримати середній зріст для 30 років і скористатися такою формулою, яка називається екстраполяцією, оскільки вік 30 виходить за межі віку, на який поширюються ваші дані.

Якщо модель має кілька коваріатів, потрібно бути обережними, оскільки важко провести межу, яку охоплюють дані.

У статистиці ми не виступаємо за екстраполяцію.


"У статистиці ми не виступаємо за екстраполяцію". Основна частка аналізу часових рядів робить саме це ....
Нік Кокс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.