Ось я на тонкому льоду, але дозвольте спробувати: у мене є відчуття (будь ласка, прокоментуйте!), Що головна відмінність між статистикою та економетрикою полягає в тому, що в статистиці ми, як правило, вважаємо регресори фіксованими, отже, матриця проектування термінології, яка, очевидно, походить від проектування експериментів, де припущення полягає в тому, що ми спочатку обираємо, а потім фіксуємо пояснювальні змінні.
Але для більшості наборів даних, більшості ситуацій, це погана відповідність. Ми дійсно спостерігаємо пояснювальні змінні, і в цьому сенсі вони стоять на тій же основі, що і змінні відповіді, вони обидва визначаються деяким випадковим процесом, що знаходиться поза нашим контролем. Розглядаючи питаннях"Виправлено", ми вирішуємо не розглядати багато проблем, які можуть викликати це.
Розглядаючи регресори як стохастичні, з іншого боку, як це прагнуть економетри, ми відкриваємо можливість моделювання, яке намагається розглянути такі проблеми. Короткий перелік проблем, які ми могли б потім розглянути та включити до моделювання, це:
- похибки вимірювання в регресорах
- співвідношення між регресорами та термінами помилок
- відстала реакція як регресора
- ...
Можливо, це слід робити набагато частіше, ніж це робиться сьогодні?
EDIT
Я спробую викласти аргумент на умову щодо регресорів дещо формальніше. Дозволяє( Y, X) бути випадковим вектором, і інтерес викликає регресію Y на Х, де регресія означає умовне очікування Y на Х. За мультинормальними припущеннями це буде лінійна функція, але наші аргументи від цього не залежать. Починаємо з факторингу щільності суглоба звичайним способом
f( у, x ) = f( у∣ x ) f( х )
але ці функції не відомі, тому ми використовуємо параметризовану модель
f( у, х ; θ , ψ ) =fθ( у∣ x )fψ( х )
де θ параметризує умовний розподіл і ψ граничний розподіл Х. У звичайній лінійній моделі ми можемо матиθ = ( β,σ2)але це не передбачається. Повний простір параметрів( θ , ψ ) є Θ × Ψ, декартовий продукт, і ці два параметри не мають спільного.
Це спочатку можна інтерпретувати як факторизацію статистичного експерименту (або процесу генерації даних, DGP) Х генерується відповідно до fψ( х ), і як другий крок, Y формується відповідно до умовної щільності fθ( у∣ X= х ). Зауважте, що перший крок не використовує ніяких знань проθ, що входить лише на другому кроці. СтатистикаХ є допоміжним для θ, див. https://en.wikipedia.org/wiki/Ancillary_statistic .
Але, залежно від результатів першого кроку, другий крок може бути більш-менш інформативним θ. Якщо розподіл заданоfψ( х ) мають дуже низьку дисперсію, скажімо, спостережувану хРосія буде зосереджена в невеликому регіоні, тому це буде складніше оцінити θ. Отже, перша частина цього двоетапного експерименту визначає точність, з якоюθможна оцінити. Тому природним є станХ= ху висновку про параметри регресії. Це аргумент обумовленості, і викладений вище текст чітко пояснює його припущення.
У розроблених експериментах його припущення здебільшого дотримуються, часто це стосується даних спостережень. Деякі приклади проблем будуть: регресія з відсталими відповідями в якості прогнозів. Умови щодо прогнозів у цьому випадку також обумовлюють відповідь! (Додам більше прикладів).
Одна з книг, в якій досить детально обговорюються ці проблеми, - це Інформаційні та експоненціальні сім'ї: У статистичній теорії О. Е. Барндорф-Нільсен. Див. Особливо розділ 4. Автор каже, що логіка розділення в цій ситуації рідко пояснюється, але дає такі посилання: Р. А. Фішер (1956) Статистичні методи та наукові висновки § 4.3і Свердруп (1966) Сучасний стан теорії рішень та теорії Неймана-Пірсона .