Які переваги / недоліки використання сплайнів, згладжених сплайнів та емуляторів процесів Гаусса?


20

Мені цікаво вивчити (і реалізувати) альтернативу поліноміальній інтерполяції.

Однак у мене виникають проблеми з пошуком хорошого опису того, як ці методи працюють, як вони співвідносяться та як їх порівнюють.

Буду вдячний за ваш внесок щодо плюсів / мінусів / умов, за яких ці методи чи альтернативи були б корисними, але було б достатньо кількох хороших посилань на тексти, слайди чи подкасти.


Це насправді дуже цікаве запитання, але, можливо, (лише, можливо) більше підходить для math.stackexchange.com ?
steffen

У "Елементах статистичного навчання " Хасті та ін. Є матеріал про сплайни та згладжування сплайнів .
NPE

8
Я вважаю, що це цілком розумне питання щодо обчислювальної статистики.
csgillespie

@csgillespie: Все, що я знаю про сплайни та інтерполяцію, я дізнався на лекціях з числових / математичних питань. Тому я, можливо, трохи упереджений;).
steffen

Відповіді:


24

Базова регресія OLS - це дуже хороша методика пристосування функції до набору даних. Однак, проста регресія підходить тільки прямої лінії , яка є постійною для всього можливого діапазону . Це може не відповідати даній ситуації. Наприклад, дані іноді показують криволінійну залежність. Це можна вирішити за допомогою регресування Y на перетворення X , f ( X ) . Можливі різні перетворення. У ситуаціях, коли зв’язок між X і Y є монотонним , але постійно звужується, перетворення журналуХYХf(Х)ХYможе бути використаний. Іншим популярним вибором є використання многочлена, де нові терміни утворюються шляхом підняття до ряду потужностей (наприклад, X 2 , X 3 тощо). Цю стратегію легко здійснити, і ви можете інтерпретувати пристосування як те, що розповідаєте, скільки «вигинів» існує у ваших даних (де кількість вигинів дорівнює найбільшій потужності, необхідній мінус 1). ХХ2Х3

Однак регресії, засновані на логарифмі чи факторі коваріату, оптимально підійдуть лише тоді, коли це точна природа справжнього зв'язку. Цілком доцільно уявити, що між і Y існує криволінійна залежність, яка відрізняється від можливостей, які вони дають. Таким чином, ми приходимо до двох інших стратегій. Перший підхід - льос , серія зважених лінійних регресій, обчислених над рухомим вікном. Цей підхід старший і краще підходить для розвідувального аналізу даних . ХY

Інший підхід полягає у використанні сплайнів. У це найпростіша, сплайн новий термін , який відноситься до тільки частини діапазону . Наприклад, X може бути від 0 до 1, а термін сплайну може бути лише від 0 до 1. У цьому випадку, .7 є вузлом . Простий, лінійний сплайн-термін був би обчислений так: X s p l i n e = { 0ХХ буде додано до вашої моделі,крімпочатковоготермінаX. Встановлена ​​модель покаже різкий розрив у .7 з прямою лінією від 0 до .7, а лінія, що продовжується з іншим нахилом від .7 до 1. Однак термін сплайну не повинен бути лінійним. Зокрема, було визначено, що кубічні сплайни особливо корисні (тобто,X 3 s p l i n e

Хсpлiне={0якщо Х.7Х-.7якщо Х>.7

ХХсpлiне3). Гострого розриву теж не повинно бути. Розроблені алгоритми, які обмежують пристосовані параметри таким чином, що перша та друга похідні збігаються у вузлах, що робить вузли неможливими для виявлення у виході. Кінцевий результат усього цього полягає в тому, що за допомогою декількох вузлів (як правило, 3-5) у місцях вибору (яке програмне забезпечення може визначити для вас) можна відтворити майже будь-якукрива. Більше того, градуси свободи обчислюються правильно, тому ви можете довіряти результатам, що неправда, коли ви спочатку подивитесь на свої дані, а потім вирішите відповідати квадрату, тому що ви побачили вигин. Крім того, все це лише черговий (хоч і складніший) варіант базової лінійної моделі. Таким чином, все, що ми отримуємо з лінійними моделями, пов'язане з цим (наприклад, прогнози, залишки, діапазони довіри, тести тощо). Це суттєві переваги.

Найпростіший вступ до цих тем, які я знаю:


6

Інтернет-нотатки Косма Шалізі щодо його лекційного курсу « Розширений аналіз даних з елементарної точки зору» є досить хорошими з цього приводу, дивлячись на речі з точки зору, коли інтерполяція та регресія - це два підходи до однієї проблеми. Я особливо зверну вашу увагу на глави про методи вирівнювання та сплайни .


Ваші посилання можуть використовувати оновлення. Я переконався, але ви повинні перевірити, чи пропоновані вами зміни редагують сторінки, які ви планували.
Грегор
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.