Базова регресія OLS - це дуже хороша методика пристосування функції до набору даних. Однак, проста регресія підходить тільки прямої лінії , яка є постійною для всього можливого діапазону . Це може не відповідати даній ситуації. Наприклад, дані іноді показують криволінійну залежність. Це можна вирішити за допомогою регресування Y на перетворення X , f ( X ) . Можливі різні перетворення. У ситуаціях, коли зв’язок між X і Y є монотонним , але постійно звужується, перетворення журналуХYХf( X)ХYможе бути використаний. Іншим популярним вибором є використання многочлена, де нові терміни утворюються шляхом підняття до ряду потужностей (наприклад, X 2 , X 3 тощо). Цю стратегію легко здійснити, і ви можете інтерпретувати пристосування як те, що розповідаєте, скільки «вигинів» існує у ваших даних (де кількість вигинів дорівнює найбільшій потужності, необхідній мінус 1). ХХ2Х3
Однак регресії, засновані на логарифмі чи факторі коваріату, оптимально підійдуть лише тоді, коли це точна природа справжнього зв'язку. Цілком доцільно уявити, що між і Y існує криволінійна залежність, яка відрізняється від можливостей, які вони дають. Таким чином, ми приходимо до двох інших стратегій. Перший підхід - льос , серія зважених лінійних регресій, обчислених над рухомим вікном. Цей підхід старший і краще підходить для розвідувального аналізу даних . ХY
Інший підхід полягає у використанні сплайнів. У це найпростіша, сплайн новий термін , який відноситься до тільки частини діапазону . Наприклад, X може бути від 0 до 1, а термін сплайну може бути лише від 0 до 1. У цьому випадку, .7 є вузлом . Простий, лінійний сплайн-термін був би обчислений так:
X s p l i n e = { 0ХХ
буде додано до вашої моделі,крімпочатковоготермінаX. Встановлена модель покаже різкий розрив у .7 з прямою лінією від 0 до .7, а лінія, що продовжується з іншим нахилом від .7 до 1. Однак термін сплайну не повинен бути лінійним. Зокрема, було визначено, що кубічні сплайни особливо корисні (тобто,X 3 s p l i n e
Хs p l i n e= { 0Х- .7якщо X≤ .7якщо X> .7
ХХ3s p l i n e). Гострого розриву теж не повинно бути. Розроблені алгоритми, які обмежують пристосовані параметри таким чином, що перша та друга похідні збігаються у вузлах, що робить вузли неможливими для виявлення у виході. Кінцевий результат усього цього полягає в тому, що за допомогою декількох вузлів (як правило, 3-5) у місцях вибору (яке програмне забезпечення може визначити для вас) можна відтворити майже
будь-якукрива. Більше того, градуси свободи обчислюються правильно, тому ви можете довіряти результатам, що неправда, коли ви спочатку подивитесь на свої дані, а потім вирішите відповідати квадрату, тому що ви побачили вигин. Крім того, все це лише черговий (хоч і складніший) варіант базової лінійної моделі. Таким чином, все, що ми отримуємо з лінійними моделями, пов'язане з цим (наприклад, прогнози, залишки, діапазони довіри, тести тощо). Це
суттєві переваги.
Найпростіший вступ до цих тем, які я знаю: