Регресія часових рядів з перекриваються даними

Я бачу регресійну модель, яка регресує річну прибутковість фондового індексу за затримкою (12 місяців) Річна прибутковість того ж біржового індексу, кредитний спред (різниця між середньомісячним значенням безризикових облігацій та корпоративних облігацій врожайність), рівень інфляції у річному обчисленні та індекс промислового виробництва за рік.

Це виглядає таким чином (хоча ви в цьому випадку заміните дані, характерні для Індії):

SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) +    
b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2)

SP500YOY - це річна віддача для індексу SP500. Для обчислення цього обчислюється середньомісячне значення SP500, а потім перетворюється на річну віддачу за кожен місяць (наприклад, Jan'10-Jan'11, Feb'10- Лютий11, Мар'10-Мар'11,.). Що стосується пояснювальних змінних, 12-місячне відставання значення SP500YOY використовується разом з CREDITSPREAD в момент T та INFLATION та INDUSTRIALPRODUCTION два періоди AHEAD. INFLATIONASYMM є манекеном щодо того, чи є рівень інфляції вище порогового значення 5,0%. Індекс у дужках показує індекс часу для кожної змінної.

Це оцінюється стандартною лінійною регресією OLS. Щоб використати цю модель для прогнозування на 1,2 та 3 місяці вперед, коли ви повернете СП 500, потрібно генерувати прогнози інфляції та індексу промислового виробництва на 3,4 та 5 місяців. Ці прогнози робляться після пристосування моделі ARIMA до кожного з двох окремо. Прогнози кредитного розповсюдження на 1,2 та 3 місяці вперед вкладаються як ментальні оцінки.

Мені хотілося б знати, чи правильна ця лінійна регресія OLS правильна / неправильна, ефективна / неефективна або загальновизнана статистична практика.

Перша проблема, яку я бачу, - це використання даних, що перекриваються. тобто добові значення індексу акцій усереднюються щомісяця, а потім використовуються для обчислення річних доходів, які перераховуються щомісяця. Це повинно зробити термін помилки автокорельованим. Я думаю, що потрібно було б скористатися деякою «корекцією» у рядках одного з наступних:

Оцінювач коваріації гетероскедастичності Білого
Оцінювач послідовності гетероскедастичності Ньюея та Веста та автокореляції (HAC)
Версія Hansen & Hodrick, що відповідає гетеросцедастичності

Чи справді має сенс застосовувати стандартну лінійну регресію OLS (без жодних виправлень) до таких даних, що перекриваються, і тим більше використовувати прогнози ARIMA на три періоди вперед для пояснювальних змінних для використання в оригінальній лінійній регресії OLS для прогнозування SP500YOY? Я раніше не бачив такої форми, а тому реально не можу її оцінити, за винятком виправлення використання спостережуваних спостережень.

regression time-series autocorrelation

— Вішал Белсаре
джерело

Будь ласка, не перехресне повідомлення .

— Джошуа Ульріх

Ось кілька статей, які стосуються цієї теми:

Бріттен-Джонс та Нойбергер, покращені умовиводи та оцінки в регресії з перекриваючими спостереженнями

Harri & Brorsen, проблема перекриття даних

— R_Coholic
джерело

З цих робіт не дуже зрозуміло, як застосовувати ці виправлення на практиці. Чи є десь практичніший посібник чи підручник?

— rinspy

@rinspy Дивіться Quant.stackexchange.com/questions/35216/… про якийсь код на Hansen &

— Hodrick

Чи можете ви надати короткий виклад інформації в цих статтях і як вони забезпечують вирішення питання?

— gung - Відновити Моніку