Загалом, я вважаю, що науково та статистично більш плідно почати з того, щоб поставити більш широке та інше запитання, яким чином можна передбачити відповідь кругового прогнозувача. Я кажу тут круговий, а не спрямований , частково тому, що останній включає сферичні та ще більш казкові простори, які не можуть бути охоплені однією відповіддю; а почасти тому, що ваші приклади, час і час року , є круговими. Наступним важливим прикладом є напрямок компаса (стосується вітрів, рухів тварин або людей, вирівнювання тощо), який характеризується багатьма круговими проблемами: дійсно, для деяких вчених це більш очевидний вихідний пункт.
Кожен раз, коли ви можете піти від цього, використання синусоїдальних і косинусних функцій часу в якійсь регресійній моделі - це простий і простий в реалізації метод моделювання. Це перший порт для багатьох біологічних та / або екологічних прикладів. (Обидва види часто поєднуються разом, оскільки біотичні явища, що демонструють сезонність, зазвичай прямо чи опосередковано реагують на клімат чи погоду.)
Щодо конкретності, уявіть собі вимірювання часу протягом 24 годин або 12 місяців, так що, наприклад
гріх[ 2 π( година / 24 ) ] , соз [ 2 π( година / 24 ) ]
гріх[ 2 π( місяць / 12 ) ] , соз [ 2 π( місяць / 12 ) ]
кожен описує один цикл протягом цілого дня або року. Офіційний тест на відсутність зв'язку між вимірюваною чи підрахунковою реакцією та деяким круговим часом буде тоді стандартним тестом на те, чи є коефіцієнти синуса та косинусу взагалі нульовими в узагальненій лінійній моделі із синусом та косинусом як провісниками, відповідним зв’язком та сімейством вибираючись відповідно до характеру відповіді.
Питання граничного розподілу відповіді (нормального чи іншого) у цьому підході є другорядним та / або має вирішуватися вибором сім'ї.
Заслуга синусів і косинусів, природно, полягає в тому, що вони періодичні і автоматично обертаються, тому значення на початку та в кінці кожного дня чи року обов'язково одне і те саме. З граничними умовами немає проблеми, бо немає межі.
Такий підхід отримав назву кругової, періодичної, тригонометричної та регресії Фур'є. Про один вступний огляд підручника дивіться тут
На практиці,
Такі тести, як правило, показують надзвичайно значні результати на звичайних рівнях, коли ми очікуємо сезонність. Більш цікавим питанням є точна оцінка сезонної кривої і чи потрібна нам більш складна модель з іншими синусоїдальними термінами.
Ніщо також не виключає інших прогнозів, і тоді нам просто потрібні більш всебічні моделі з іншими включеними прогнозами, скажімо, синусами та косинусами на сезонність та іншими прогнозами для всього іншого.
У якийсь момент, залежно від даних, проблеми та смаків та досвіду дослідника, може стати більш природним підкреслити аспект проблеми часового ряду та побудувати модель із явною залежністю від часу. Дійсно, деякі статистично налаштовані люди заперечують, що існує інший спосіб наблизитись до цього.
Те, що легко назвати трендом (але не завжди так легко визначити), підпадає під №2 або №3, або навіть обох.
Багато економістів та інших соціальних науковців, що переймаються сезонністю на ринках, національній та міжнародній економіці чи іншими людськими явищами, як правило, більше вражають можливостями більш складної мінливості протягом кожного дня або (частіше) року. Часто, хоча і не завжди, сезонність - це неприємність, яку потрібно усунути або коригувати, на відміну від біологічних та екологічних вчених, які часто вважають сезонність цікавою і важливою, навіть головним напрямком проекту. З цього приводу, економісти та інші також часто застосовують регресійний підхід, але з боєприпасами - пучок змінних індикаторів (фіктивних), найпростіше змінних на кожен місяць або кожен квартал року0 , 1. Це може бути практичним способом намагатися вловити наслідки названих свят, періодів відпусток, побічних шкільних років тощо, а також впливів або потрясінь кліматичного чи погодного походження. З урахуванням цих відмінностей, більшість коментарів, зазначених вище, стосуються також економічних та соціальних наук.
Ставлення та підходи епідеміологів та медичних статистиків, пов'язаних із різницею захворюваності, смертності, прийому до лікарень, відвідування клініки тощо, зазвичай стикаються між цими двома крайнощами.
На мій погляд, розділення днів або років на половинки для порівняння зазвичай довільне, штучне і в кращому випадку незручне. Він також ігнорує тип гладкої структури, як правило, присутній у даних.
EDIT Наразі обліковий запис не вирішує різницю між дискретним та безперервним часом, але я зі свого досвіду не вважаю це великою справою на практиці.
Але точний вибір залежить від того, як надходять дані та від форми зміни.
Якби дані були щоквартальними та людськими, я б схильний використовувати показники змінних (наприклад, чверті 3 та 4 часто відрізняються). Якщо щомісяця і людині, вибір не є зрозумілим, але вам доведеться наполегливо працювати, щоб продати синуси та косинуси більшості економістів. Якщо щомісяця або тонкіші та біологічні чи екологічні, безумовно, синуси та косинуси.
EDIT 2 Детальніше про тригонометричну регресію
Відмітною деталлю тригонометричної регресії (названої будь-яким іншим способом, якщо вам зручніше) є те, що майже завжди синусоїдальні та косинусні терміни найкраще представлені моделі в парах. Спочатку ми масштабуємо час доби, час року чи напрямок компаса, щоб він був представлений як кут на коло
у радіанах, отже, на проміжку [ 0 , 2 π ] . Тоді використовуємо стільки пар sin k θ , cos k θ , k = 1 , 2 , 3 , …θ[ 0 , 2 π]гріхk θ , cosk θ , k = 1 , 2 , 3 , …як це потрібно в моделі. (У круговій статистиці тригонометричні конвенції мають тенденцію до козиру статистичних умов, тому грецькі символи, такі як , використовуються як для змінних, так і параметрів.)θ , ϕ , ψ
Якщо ми пропонуємо пару предикторів, таких як для регресійної моделі, то ми маємо оцінки коефіцієнтів, скажімо, b 1 , b 2 , для термінів в моделі, а саме b 1 sin θ , b 2 cos θ . Це спосіб підгонки фази, а також амплітуда періодичного сигналу. Інакше кажучи, таку функцію, як sin ( θ + ϕ ), можна переписати якгріхθ , cosθб1, б2б1гріхθ , b2cosθгріх( θ + ϕ )
гріхθ cosϕ + cosθ гріхϕ ,
але і sin ϕ, що представляють фазу, оцінюються в моделі підгонки. Таким чином ми уникаємо нелінійної проблеми оцінки.cosϕгріхϕ
Якщо ми використовуємо для моделювання кругової варіації, то автоматично максимум і мінімум цієї кривої знаходяться на півкруга один від одного. Це часто є дуже хорошим наближенням до біологічних чи екологічних змін, але, навпаки, нам може знадобитися ще кілька термінів, зокрема для того, щоб визначити економічну сезонність. Це може бути дуже вагомою причиною використання натомість змінних індикаторів, які негайно призводять до простої інтерпретації коефіцієнтів.б1гріхθ + b2cosθ