Використання кругових предикторів при лінійній регресії


19

Я намагаюся підігнати модель, використовуючи дані про вітер (0, 359) та час доби (0, 23), але я стурбований тим, що вони погано впишуться в лінійну регресію, оскільки самі по собі не є лінійними параметрами. Я хотів би перетворити їх за допомогою Python. Я бачив деякі згадки про обчислення середнього вектора шляхом взяття гріха і cos градусів, принаймні у випадку вітру, але не в цілому ряді.

Чи є бібліотека Python або відповідний метод, який може бути корисним?


1
Дякую, що поставили це як питання. Зауважте, що запит коду чи бібліотек поза темою (основна частина вашого питання, безумовно, тематична), тому цей аспект може бути або не може бути охоплений відповідями тут.
gung - Відновіть Моніку

Яка тут змінна відповіді (результат, залежна змінна)? Чи є напрямок вітру та час доби обома прогнозами?
Нік Кокс

@NickCox Так, і напрямок вітру, і час доби - це предиктори. Результат - ціле значення, що представляє концентрацію частинок (забруднення повітря). Є й інші прогнози, включаючи температуру, вологість тощо ... але я вважаю, що їх не потрібно змінювати.
compguy24

1
Я взяв на себе сміливість редагувати заголовок. Попередня назва "Лінійний розподіл градусів навколо кола" на мою думку зовсім не сприймала питання.
Нік Кокс

Відповіді:


24

0=360

гріх(π напрямок/180),cos(π напрямок/180)

2π=360

гріх(π час/12),cos(π час/12)

або

гріх(π(час+0,5)/12),cos(π(час+0,5)/12)

залежно від того, як саме було записано час або його слід інтерпретувати.

Іноді природа чи суспільство зобов’язують і залежність від кругової змінної має форму деякого напрямку, оптимального для реакції, а протилежний напрямок (половина кола) песимальний. У цьому випадку може бути достатньо одного синусового та косинусного термінів; для більш складних моделей можуть знадобитися інші терміни. Більш детально докладний підручник з цієї методики кругової, Фур'є, періодичної, тригонометричної регресії можна знайти тут , у свою чергу, з подальшими посиланнями. Хороша новина полягає в тому, що, коли ви створили синусоїдичні і косинусні умови, вони є лише додатковими прогнозами вашої регресії.

Існує велика література з кругової статистики, яка розглядається як частина спрямованої статистики. Як не дивно, про цю методику часто не згадують, оскільки акцент у цій літературі зазвичай є змінними кругової відповіді. Узагальнення кругових змінних за їх векторними засобами - це стандартний описовий метод, але не потрібен або прямо допомагає для регресії.

Деякі деталі щодо термінології Напрямок вітру та час доби є статистичними змінними, а не параметрами, незалежно від використання у вашій галузі науки.

уХββХ[-1,1]

Випадковий коментар Для змінної відповіді, такої як концентрація частинок, я б очікував використовувати узагальнену лінійну модель з логарифмічним зв’язком для забезпечення позитивних прогнозів.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.