Основна настройка:
модель регресії: де C - вектор керуючих змінних.
Мене цікавить і очікую, що та будуть негативними. Однак у моделі є проблема мультиколінеарності, коефіцієнт кореляції задається через, corr ( , 0,9345, corr ( , 0,1765, corr ( , 0,3019.
Тож та дуже співвідносяться, і вони повинні практично надавати однакову інформацію. У мене три регресії:
- виключити змінну ; 2. виключити змінну ; 3. оригінальна модель з та .
Результати:
Для регресії 1 та 2 вона дає очікуваний знак для та відповідно та з аналогічною величиною. І і є значущими на 10% в обох моделях після того, як я виправляю HAC у стандартній помилці. позитивний, але не суттєвий для обох моделей.
Але для 3 має очікуваний знак, але знак для позитивний з величиною вдвічі більшою за в абсолютному значенні. І і незначні. Більше того, величина для зменшується майже вдвічі порівняно з регресією 1 та 2.
Моє запитання:
Чому в 3 знак стає позитивним і набагато більшим, ніж в абсолютному значенні? Чи є якась статистична причина того, що може перевертати знак і має велику величину? Або це тому, що в моделях 1 і 2 страждає проблема пропущеної змінної, яка завищена умови, що позитивно впливає на y? Але тоді в регресійній моделі 1 і 2 обидва і повинні бути позитивними замість негативних, оскільки загальний ефект і в регресійній моделі 3 є позитивним.