Я бачу регресійну модель, яка регресує річну прибутковість фондового індексу за затримкою (12 місяців) Річна прибутковість того ж біржового індексу, кредитний спред (різниця між середньомісячним значенням безризикових облігацій та корпоративних облігацій врожайність), рівень інфляції у річному обчисленні та індекс промислового виробництва за рік.
Це виглядає таким чином (хоча ви в цьому випадку заміните дані, характерні для Індії):
SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) +
b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2)
SP500YOY - це річна віддача для індексу SP500. Для обчислення цього обчислюється середньомісячне значення SP500, а потім перетворюється на річну віддачу за кожен місяць (наприклад, Jan'10-Jan'11, Feb'10- Лютий11, Мар'10-Мар'11,.). Що стосується пояснювальних змінних, 12-місячне відставання значення SP500YOY використовується разом з CREDITSPREAD в момент T та INFLATION та INDUSTRIALPRODUCTION два періоди AHEAD. INFLATIONASYMM є манекеном щодо того, чи є рівень інфляції вище порогового значення 5,0%. Індекс у дужках показує індекс часу для кожної змінної.
Це оцінюється стандартною лінійною регресією OLS. Щоб використати цю модель для прогнозування на 1,2 та 3 місяці вперед, коли ви повернете СП 500, потрібно генерувати прогнози інфляції та індексу промислового виробництва на 3,4 та 5 місяців. Ці прогнози робляться після пристосування моделі ARIMA до кожного з двох окремо. Прогнози кредитного розповсюдження на 1,2 та 3 місяці вперед вкладаються як ментальні оцінки.
Мені хотілося б знати, чи правильна ця лінійна регресія OLS правильна / неправильна, ефективна / неефективна або загальновизнана статистична практика.
Перша проблема, яку я бачу, - це використання даних, що перекриваються. тобто добові значення індексу акцій усереднюються щомісяця, а потім використовуються для обчислення річних доходів, які перераховуються щомісяця. Це повинно зробити термін помилки автокорельованим. Я думаю, що потрібно було б скористатися деякою «корекцією» у рядках одного з наступних:
- Оцінювач коваріації гетероскедастичності Білого
- Оцінювач послідовності гетероскедастичності Ньюея та Веста та автокореляції (HAC)
- Версія Hansen & Hodrick, що відповідає гетеросцедастичності
Чи справді має сенс застосовувати стандартну лінійну регресію OLS (без жодних виправлень) до таких даних, що перекриваються, і тим більше використовувати прогнози ARIMA на три періоди вперед для пояснювальних змінних для використання в оригінальній лінійній регресії OLS для прогнозування SP500YOY? Я раніше не бачив такої форми, а тому реально не можу її оцінити, за винятком виправлення використання спостережуваних спостережень.