Які критерії та рішення щодо нелінійності у статистичних моделях?


10

Я сподіваюся, що наступне загальне питання має сенс. Будь ласка, майте на увазі, що для цілей цього конкретного питання мене не цікавлять теоретичні (предметні області) причини введення нелінійності. Тому сформулюю повне запитання наступним чином:

Що таке логічна база ( критерії та, якщо можливо, процес прийняття рішень ) для введення нелінійності в статистичні моделі з інших причин, ніж теоретичні (предметна область)? Як завжди, також вітаються відповідні ресурси та довідки.

Відповіді:


7

Процес побудови моделі передбачає, що модельєр приймає багато рішень. Одне з рішень передбачає вибір серед різних класів моделей для дослідження. Є багато класів моделей, які можна було б врахувати; наприклад, моделі ARIMA, моделі ARDL, множинне джерело помилок State-Space, моделі LSTAR, моделі Min-Max. Звичайно, деякі класи моделей ширші, ніж інші, і не часто зустрічається виявлення, що деякі класи моделей є підкласами інших.

Враховуючи характер питання, ми можемо зосередитись переважно лише на двох класах моделей; лінійні моделі та нелінійні моделі .

Маючи на увазі вищезгадану картину, я розпочну розглядати питання ОП, коли корисно прийняти нелінійну модель і якщо є логічна база для цього - з статистичної та методологічної точки зору.

Перше, що слід помітити, це те, що лінійні моделі - це невеликий підклас нелінійних моделей. Іншими словами, лінійні моделі - це особливі випадки нелінійних моделей. Є кілька винятків із цього твердження, але, для нинішніх цілей, ми не дуже втратимо, прийнявши його для спрощення питань.

Зазвичай конструктор моделей вибере клас моделей і приступить до вибору моделі з цього конкретного класу, використовуючи певну методологію. Простий приклад - коли вирішується моделювати часовий ряд як процес ARIMA, а потім слідує методології Box-Jenkins для вибору моделі серед класу моделей ARIMA. Працювати таким чином, з методологіями, пов'язаними з сімействами моделей, є практичною необхідністю.

Наслідком рішення щодо побудови нелінійної моделі є те, що проблема вибору моделі стає набагато більшою (потрібно розглядати більше моделей і приймати більше рішень) порівняно з вибором з меншого набору лінійних моделей, тому існує реальна практичне питання під рукою. Крім того, можуть бути навіть не повністю розроблені методології (відомі, прийняті, зрозумілі, прості у спілкуванні), які використовуються для вибору з деяких сімей нелінійних моделей. Крім того, ще одним недоліком побудови нелінійних моделей є те, що лінійні моделі легші у використанні, а їхні ймовірнісні властивості більш відомі ( Teräsvirta, Tjøstheim, Granger (2010) ).

Зважаючи на це, ОП вимагає статистичних підстав для керівництва рішенням, а не практичних або теоретичних теорій, тому я повинен продовжувати.

Перш ніж навіть роздумувати над тим, як розібратися з тим, з якими нелінійними моделями працювати, слід спочатку вирішити, чи замість цього працювати з лінійними або нелінійними моделями. Рішення! Як зробити цей вибір?

Звертаючись до Грейнджера і Терасвірта (1993) , я приймаю наступний аргумент, який має два основні моменти у відповіді на наступні два питання.

Питання: Коли корисно побудувати нелінійну модель? Коротше кажучи, може бути корисним побудувати нелінійну модель, коли клас лінійних моделей вже вважався і вважається недостатнім для характеристики взаємозв'язку, що перевіряється. Цю процедуру нелінійного моделювання (процес прийняття рішень) можна сказати, що вона переходить від простого до загального, в тому сенсі, що вона переходить від лінійного до нелінійного.

З: Чи є статистичні підстави, які можна використовувати для обґрунтування побудови нелінійної моделі? Якщо хтось вирішить побудувати нелінійну модель за результатами тестів на лінійність, я б сказав, так, є. Якщо тестування на лінійність свідчить про відсутність значної нелінійності у взаємозв'язку, тоді побудова нелінійної моделі не рекомендується; тестування повинно передувати рішення про побудову.

Я буду детально розглядати ці моменти, прямо посилаючись на Грейнджер і Терасвірта (1993):

Перш ніж будувати нелінійну модель, доцільно з’ясувати, чи дійсно лінійна модель адекватно характеризувала [економічні] взаємозв'язки, що аналізуються. Якби це було так, існувало б більше статистичної теорії для побудови розумної моделі, ніж якби нелінійна модель була доречною. Крім того, отримання оптимальних прогнозів на більш ніж один період вперед буде набагато простішим, якби модель була лінійною. Може статися, щонайменше, коли часовий ряд короткий, що дослідник успішно оцінює нелінійну модель, хоча справжня залежність між змінними є лінійною. Отже, небезпека зайвого ускладнення побудови моделі є реальною, але її можна зменшити за допомогою тестування на лінійність.

У новітній книзі «Терясвірта, Тьостхайм та Грейнджер» (2010) даються такі самі поради, які я цитую зараз:

З практичної точки зору [тому] корисно перевірити лінійність, перш ніж намагатися оцінити більш складну нелінійну модель. У багатьох випадках тестування навіть необхідне зі статистичної точки зору. Ряд популярних нелінійних моделей не визначається лінійністю. Якщо справжня модель, яка генерувала дані, лінійна, а нелінійна модель зацікавлена ​​в гнізді цієї лінійної моделі, параметри нелінійної моделі не можуть бути оцінені послідовно. Таким чином, тестування лінійності повинно передувати будь-якому нелінійному моделюванню та оцінці.

Дозвольте закінчити на прикладі.

У контексті моделювання ділових циклів практичним прикладом використання статистичних підстав для обгрунтування побудови нелінійної моделі може бути наступний. Оскільки лінійні одновимірні або векторні авторегресивні моделі не в змозі генерувати асиметричні циклічні часові ряди, варто розглянути нелінійний підхід моделювання, який може впоратися з асиметріями в даних. Розширену версію цього прикладу про оборотність даних можна знайти в Tong (1993) .

Вибачте, якщо я занадто багато сконцентрувався на моделях часових рядів. Я впевнений, що деякі ідеї застосовні і в інших налаштуваннях.


2
Graeme, твоя відповідь відмінна, і в той час як інші відповіді також відмінні, твоя найближча до того, що я шукав (міні-версія, якщо ти хочеш). +1 та прийнято. Я дуже ціную ваші зусилля щодо підготовки вашої відповіді. Я впевнений, що перегляну його ще не раз, а також посилання. Я думаю, що книга доктора Харрелла про регресійні стратегії також містить деякі частини основи, яку я в ідеалі мав би. До речі, моє уявлення про тематичну статистичну основу надихає чудова книга Лізи Харлоу «Суть багатоваріантного мислення», яку я із задоволенням прочитала.
Олександр Блех

12

Питання над архівуванням полягає у вирішенні того, які типи проблем слід очікувати, інакше дозволяти відносинам бути нелінійними, як дозволяє розмір вибірки. Більшість процесів у біології, соціальних науках та інших галузях є нелінійними. Єдині ситуації, коли я очікую лінійних відносин:

  1. Ньютонівська механіка
  2. YY

Y

Я рідко бачу відносини, які скрізь лінійні у великому наборі даних.

Рішення про включення нелінійностей до регресійних моделей випливає не стільки з глобального статистичного принципу, скільки з того, як працює світ. Один виняток - коли було обрано неоптимальну статистичну структуру, а нелінійності чи умови взаємодії потрібно ввести лише для поганого вибору структури. Терміни взаємодії іноді можуть знадобитися для компенсації недостатнього моделювання (наприклад, припускаючи лінійність) основних ефектів. Можуть знадобитися інші основні ефекти для компенсації втрат інформації внаслідок недостатнього моделювання інших основних ефектів.

Іноді дослідники агонізують, чи потрібно включати певну змінну, коли вони підходять безлічі інших змінних, змушуючи їх діяти лінійно. На мій досвід, припущення про лінійність є одним із найбільш порушених з усіх припущень, які мають велике значення.


2
+1 Доктор Харрелл, дякую за цінну відповідь. Я розумію ваші моменти. Однак мені також цікаво (і це фактично була суть мого питання), коли досліднику або вченому-досліднику доводиться вводити додаткові нелінійні компоненти завдяки статистичним теоріям або різним питанням (включаючи статистичні дані, методи, методологію тощо) .), не підлягають теоріям доменів. Буду вдячний за вашу думку про це.
Олександр Блех

5
Лінійність залежить стільки (або більше) від даних, скільки від процесу. Більшість процесів у більшості полів є лінійними, коли їх досліджують у досить вузькому діапазоні (саме тому обчислення настільки корисно) та є нелінійними у досить широкому діапазоні (включаючи механічні процеси). Хоча коректно припустити, що майже все може здатися нелінійним, коли є достатньо великий розмір вибірки, можливо, більш прагматичним способом вирішення цього питання є те, як вирішити, коли корисно прийняти лінійну модель.
whuber

2
@whuber: Дякую за Ваш коментар. Дуже корисний. Тепер я краще розумію (не) лінійність з двох позицій : теоретичної (предметної області) та орієнтованої на дані . Мені все ще цікаво щодо статистичних та / або методологічних перспектив введення додаткової нелінійності через статистичні припущення , проблеми (тобто, після ЗНО) або подібні аспекти. Тож, крім запропонованого вами питання, я також зацікавлений у прийнятті рішень, коли корисно приймати нелінійну модель.
Олександр Блех

1
"Більшість процесів у більшості полів є лінійними, коли їх вивчають у досить вузькому діапазоні (саме тому Обчислення настільки широко корисне) і є нелінійними в достатньо широкому діапазоні", хоча надзвичайно очевидно для всіх, хто взяв курс на обчислення, це відкриття очей для мене розуміння. Дякую, доктор @whuber +1.
mugen

3
@ Олександр Блех, ви шукаєте, скажімо, статистичний тест або залишковий графік, який дасть вам статистичну причину (на відміну від причини, що випливає з основної теорії) для обгрунтування використання нелінійної моделі?
mugen

4

yi=α+βxi+εi
yi=α+βxi+γxi2+εi
γє суттєвим, можливо, це стосується нелінійної моделі. Інтуїція - це, звичайно, розширення Тейлора. Якщо у вас лінійна функція, тільки перша похідна повинна бути ненульовою. Для нелінійних функцій похідні вищого порядку були б нульовими.

γ β

yi=α+βmax(0,xi)+γmin(0,xi)+εi
γβ

Іноді в моїх даних є якісь особливі значення або смуги; або мої гістограми пояснювальних змінних мають перегини та перегини. Отже, я випробую лінійні сплайни навколо цих спеціальних точок або регіонів. Найпростішими лінійними сплайнами були б: Це ввело б різні нахили для до та після точки . Ви можете мати кілька схилів для однієї змінної в різних регіонах. Якщо мій лінійний сплайн є значущим, то я або граю з точками вузлів і використовую його, або думаю про нелінійні моделі.x a + = max ( x , a ) x x = a

xa=min(x,a)
xa+=max(x,a)
xx=a

Це не системний підхід, але це лише одна з речей, які я завжди роблю.


1
+1 Цікаві відомості. Дякую вам за обмін - це добре знати. Що я хотів би мати (або навіть підготувати) - це узгоджена структура / робочий процес подібних (великих і малих) підходів, що лежать в основі основних міркувань. Як ви вважаєте, що створення таких рамок було б 1) можливим та 2) цінним для інших людей?
Олександр Блех

1
@AleksandrBlekh, я не думаю, що можливо створити універсальну основу. Найзагальніший у часових рядах - Box-Jenkins.
Аксакал

4
Статистичне тестування для вибору моделі буде спотворювати оцінки та особливо стандартні помилки.
Френк Харрелл

1
@ssdecontrol, аргумент розширення Тейлора також змушує мене остерігатися не використовувати поліноми нижнього порядку. Наприклад, якщо специфікацією кандидата є , то у вас повинна бути чітка думка щодо форми вашої моделі. yi=β2xi2+εi
Аксакал

2
@ssdecontrol: Див. Venables (1998), "Ексегеси на лінійних моделях", Конференція користувачів S-Plus, Вашингтон, щоб отримати докладнішу інформацію про евристику серії Taylor.
Scortchi
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.