Які основні філософські, методологічні та термінологічні відмінності між економетрикою та іншими статистичними сферами?


70

Економетрія суттєво збігається з традиційною статистикою, але часто використовує власний жаргон з різних тем ("ідентифікація", "екзогенна" тощо). Я одного разу почув професора прикладної статистики в іншій галузі коментаря, що часто термінологія інша, але поняття однакові. Однак він також має свої методи та філософські відмінності (на думку спадає відомий твір Гекмана).

Які термінологічні відмінності існують між економетрикою та основною статистикою, і де поля розходяться, щоб стати різними в більш ніж просто термінології?

Відповіді:


96

Існують деякі термінологічні відмінності, коли одне і те ж називається різними назвами в різних дисциплінах:

  1. Поздовжні дані в біостатистиці - це повторні спостереження одних і тих же осіб = панельні дані в економетриці.
  2. Модель для бінарної залежної змінної, в якій ймовірність 1 моделюється як , називається логіт-моделлю в економетрії, а логістичною моделлю в біостатистиці. Біостатистики прагнуть працювати з логістичною регресією за коефіцієнтом шансів, оскільки їх s часто є двійковими, тому коефіцієнти шансів представляють відносну частоту результату інтересу для двох груп населення. Це настільки поширена інтерпретація, що ви часто бачите суцільну змінну, перетворену на дві категорії (низький проти високого артеріального тиску), щоб полегшити цю інтерпретацію.1/(1+exp[xβ])x
  3. "Оцінювальні рівняння" статистиків - це "моментні умови" економетриків. статистики - оцінки екстремуму економетриків.M

Існують термінологічні відмінності, коли один і той же термін використовується для позначення різних речей у різних дисциплінах:

  1. Фіксовані ефекти означають в рівнянні регресії для статистиків ANOVA, а для економетриків - оцінку "всередині".xβ
  2. Надійний висновок означає, що для економістів (з розширеннями на кластеризовані стандартні помилки та / або стандартні помилки з виправленням автокореляції) виправлені стандартні помилки, що виправляються гетерокедастичністю, та методи, які є надійними для далеких людей, які не відповідають сталим статистикам.
  3. Схоже, економісти мають смішне уявлення, що стратифіковані зразки - це ті, у яких ймовірність відбору змінюється між спостереженнями. Їх слід назвати неоднаковими зразками ймовірності. Стратифіковані зразки - це ті, у яких сукупність розбивається на заздалегідь визначені групи за характеристиками, відомими до того, як відбудеться відбір проб.
  4. "Оцінка даних" економетриків (принаймні в літературі 1980-х років) означала багаторазове тестування і пов'язані з цим підводні камені, які були чудово пояснені в книзі Гаррелла . Процедури видобутку даних комп'ютерних вчених (і статистиків) - непараметричні методи пошуку шаблонів даних, також відомі як статистичне навчання .

Я бачу унікальний внесок економетрики

  1. Способи боротьби з ендогенністю та погано заданими регресійними моделями, визнаючи, як mpiktas пояснив в іншій відповіді , що (i) пояснювальні змінні можуть самі бути випадковими (і, отже, корелювати з помилками регресії, що створюють зміщення в оцінках параметрів), (ii) моделі можуть страждати від опущених змінних (які потім стають частиною терміна помилки); (iii) може спостерігатися непомічена неоднорідність того, як економічні агенти реагують на стимули, тим самим ускладнюючи стандартні моделі регресії. Angrist & Pischke - чудовий огляд цих питань, і статистики дізнаються багато нового про те, як зробити з нього регресійний аналіз. Принаймні, статистикам слід вивчити і зрозуміти регресію інструментальних змінних.
  2. Загалом, економісти хочуть зробити якомога менше припущень щодо своїх моделей, щоб переконатися, що їхні висновки не залежать від чогось такого смішного, як багатоваріантна нормальність. Ось чому ГММ користується величезною популярністю у економістів і ніколи не потрапляє в статистику (хоча Фергюсон був описаний як мінімум наприкінці 1960-х). Ось чому прийняття емпіричної ймовірності зростало експоненціально в економетрії, але лише в статистиці мало. Ось чому економісти ведуть свою регресію з "надійними" стандартними помилками, а статистики - зі стандартними помилками OLS .χ2s2(XX)1
  3. У часовій області було багато роботи з регулярно розподіленими процесами - ось так збираються макроекономічні дані. Унікальний внесок включає інтегровані та коінтегровані процеси та методи авторегресивної умовної гетероскедастичності ((G) ARCH). Я, як правило, мікросуб'єкт, я з ними менш знайомий.

В цілому економісти прагнуть шукати сильної інтерпретації коефіцієнтів у своїх моделях. Статистики використовуватимуть логістичну модель як спосіб дійти до ймовірності позитивного результату, часто як простий прогнозний пристрій, а також можуть відзначити інтерпретацію GLM з приємними експонентними сімейними властивостями, якими він володіє, а також зв’язки з дискримінантним аналізом. Економісти думають про корисність інтерпретації моделі logit і будуть стурбовані тим, що в цій моделі ідентифікується лише , і що гетерокедастичність може її скинути. (Статистикам буде цікаво, щоβ/σσ Звичайно, економісти говорять про економістів.) Звичайно, утиліта, яка є лінійною у своїх входах, є дуже смішною річчю з точки зору мікроекономіки 101, хоча деякі узагальнення на напіввігнуті функції, ймовірно, зроблені в Мас-Колле.

Те, що економісти, як правило, пропускають, але, IMHO, виграло б, це аспекти багатоваріантного аналізу (включаючи приховані змінні моделі як спосіб боротьби з помилками вимірювань та численними проксі-серверами ... статистики, однак, не звертають уваги на ці моделі) , регресійна діагностика (усі ці відстані Кука, C_pCp, DFBETA та ін.), Аналіз відсутніх даних (часткова ідентифікація Манського, безумовно, фантазія, але корисніше розбиття MCAR / MAR / NMAR та багаторазова імпутація), а також статистика опитування. Дуже багато інших внесків з основних статистичних даних розважали економетрикою і приймали або як стандартну методологію, або передавали її як короткочасну модель: моделі ARMA 1960-х років, ймовірно, більш відомі в економетрії, ніж у статистиці, як деякі програми випускників в статистиці може не запропонувати курс часових рядів у ці дні; оцінювачі усадки / регресія хребта 1970-х років прийшли і пішли; черевик 1980-х років - це реакція на коліна в будь-яких складних ситуаціях, хоча економістам потрібно краще усвідомлювати обмеження завантажувальної програми; емпірична ймовірність 90-х років бачила більше розробки методології у теоретичних економетриків, ніж у теоретичних статистиків; обчислювальні байєсівські методи 2000-х років розважаються в економетрії, але я вважаю, що вони занадто параметричні, занадто сильні на основі моделей, щоб бути сумісними з парадигмою стійкості, про яку я згадував раніше. Незалежно від того, чи знайдуть економісти використання статистичного навчання / біоінформатики чи просторово-часових речей, які надзвичайно гарячі в сучасній статистиці, це відкритий заклик.


14
+1 Це чудовий приклад того, які чудові відповіді можуть з’явитися, коли питання відкриється для різноманітної спільноти.
whuber

1
@whuber, дякую за коментар. Дисциплінарні розриви мене заганяють, відверто кажучи.
Стаск

@StasK Відмінна відповідь. Хоча одна швидка точка. "В цілому економісти прагнуть шукати сильної інтерпретації коефіцієнтів у своїх моделях". Строго кажучи, це дещо помилково, оскільки в аналізі VAR (який дуже популярний, тому не слід говорити про ваше твердження як «загальний»), центральна точка полягає в інтерпретації функцій імпульсного реагування, а не в інтерпретації коефіцієнтів моделі (часто , вони занадто складні, щоб спробувати інтерпретувати).
Graeme Walsh

@GraemeWalsh - Я бачу, як я вже сказав, я не працюю в макро / часових рядах. Дякуємо, що вказали на це.
Стаск

20

Найкраще це пояснити з точки зору лінійної регресії, оскільки це основний інструмент економетрики. У лінійній регресії у нас є модель:

Y=Xβ+ε

Основна відмінність між іншими статистичними полями та економетрикою полягає в тому, що розглядається як фіксований в інших полях і трактується як випадкова величина в економетриці. Додатковий догляд, який ви повинні використовувати для налаштування цієї різниці, створює різні жаргони та різні методи. Загалом можна сказати, що всі методи, що використовуються в економетриці, є тими ж методами, що і в інших полях статистики, з коригуванням випадковості пояснювальних змінних. Помітним винятком є ГММ , яка є унікальним економетричним інструментом.X

Інший спосіб розгляду різниці полягає в тому, що дані в інших статистичних полях можуть розглядатися як вибірковий номер. У економетриці дані у багатьох випадках - це зразок із стохастичного процесу, з них iid - лише окремий випадок. Звідси знову різний жаргон.

Знання вищезазначеного, як правило, досить, щоб легко перейти з інших статистичних полів до економетрики. Оскільки зазвичай дається модель, не важко розібратися, що є що. На мою особисту думку, різниця в жаргоні між машинним навчанням та класичною статистикою значно більша, ніж між економетрикою та класичною статистикою.

Зауважте, що існують терміни, що мають суттєве значення в статистиці без економетрики. Основним прикладом є фіксовані та випадкові ефекти. Статті у Вікіпедії про ці терміни - це безлад, змішуючи економетрику зі статистикою.


5
"Основний приклад - це фіксовані та випадкові ефекти. Статті у Вікіпедії про ці терміни - це безлад, змішуючи економетрику зі статистикою". Такий справжній.
Михайло Єпископ

8

Одна тонка різниця полягає в тому, що економісти іноді приписують значення термінам помилок у моделях. Особливо це стосується "структурних" економістів, які вважають, що можна оцінити структурні параметри, що представляють інтерес або індивідуальну неоднорідність.

Класовим прикладом цього є probit. Хоча статистики, як правило, агностичні щодо того, що викликає термін помилки, економісти часто розглядають терміни помилок у регресіях як такі, що представляють неоднорідність уподобань. У випадку пробіту ви можете моделювати рішення жінки приєднатися до робочої сили. Це визначатиметься різноманітними змінними, але термін помилки буде представляти собою незастережений ступінь, до якого індивідуальні вподобання до роботи можуть змінюватися.


4
Хоча статистики можуть бути агностичними щодо того, що викликає термін помилки, це не означає, що вони не піклуються про це. Те, що ви описуєте, - це неоднорідність терміна помилки, а це означає, що звичайні припущення щодо термінів помилки не виконані. Жоден статистик цього не проігнорує.
mpiktas

2
Цікаво, що в цьому випадку немає проблеми з формою терміна помилки. Статистики та економісти будуть вставати на озброєння і турбуватимуться про гетерокедастичність чи будь-які інші умови помилки, що не є. Однак, навіть якщо термін помилки N (0,1), як у пробіті, економісти схильні дати йому економічну інтерпретацію.
d_a_c321

5
Це стосується моделювання в цілому. По мірі мого досвіду інтерпретація моделі по-особливому не обмежується економістами.
mpiktas

Я не погоджуюсь. Економісти явно мають монополію на розумне тлумачення моделей <просто жартую!>. Хороший момент, хоча.
d_a_c321

8

Звичайно, будь-які широкі твердження мають бути занадто широкими. Але мій досвід показав, що економетрика стурбована причинно-наслідковими зв’язками, і статистика стала більше зацікавлена ​​в прогнозуванні.

Що стосується економіки, ви не можете уникнути літератури "революції довіри" ( здебільшого нешкідливої ​​економетрії тощо). Економісти зосереджені на впливі певного режиму на певний результат з огляду на оцінку та рекомендації політики.

Що стосується статистики, то помітними є приклади видобутку даних / машинного навчання з додатками до онлайн-аналітики та генетики. Тут дослідників більше цікавить прогнозування поведінки чи стосунків, а не точне їх пояснення; вони шукають закономірності, а не причини.

Я також зазначу, що статистики традиційно більше цікавилися експериментальним дизайном, повертаючись до сільськогосподарських експериментів у 30-ті роки.


7

Я помітив, що порівняно з тим, що я б назвав основним статистичним науком, економетрики здаються неохоче використовувати графіки, або схематичні, або на основі даних. Висвітлення регресії, яка, природно, є ще центральнішою в економетрії, ніж деінде, є головним випадком. Сучасні вступи до регресії статистиками підкреслюють усю цінність побудови даних та побудови результатів регресії, включаючи діагностичні графіки, тоді як лікування в текстах економетрики є явно більш формальним. Провідні тексти в економетрії не містять багатьох графіків і не сприяють їхній силі.

Важко проаналізувати це, не маючи ризику здатися недипломатичним чи гіршим, але я б здогадався, що таке поєднання наведено як внесок.

  1. Бажання суворості. Економетристи, як правило, є підозрілими або ворожими до вивчення даних і настійно вважають за краще, щоб рішення ґрунтувалися на формальних тестах (коли вони не виходять із теореми). Це пов'язано з перевагою моделей, що базуються на "теорії" (хоча це може означати лише те, що предиктор був згаданий раніше в роботі якогось економіста, не кажучи про дані).

  2. Публікаційні практики. Документи для журналів з економіки або економетрики важкі з високо стилізованими таблицями коефіцієнтів, стандартними помилками, t-статистикою та P-значеннями. Додавання графіків навіть не замислюється у багатьох випадках, і якщо це можливо, було б запропоновано для вирізання рецензентами. Ці практики стали впроваджуватися впродовж покоління чи більше настільки, наскільки вони стали автоматичними, з жорсткими умовами щодо головного рівня значущості тощо.

  3. Графіка для складних моделей. Мовчазні графіки ігноруються, коли це не здається, ніби є графік, який відповідає складній моделі з безліччю прогнозів тощо, тощо. (Що дійсно часто важко визначити).

Звичайно, те, що я пропоную, - це різниця в засобах, як би це було, і я визнаю велику мінливість в обох випадках.


4

На відміну від більшості інших кількісних дисциплін, економіка займається речами на МАРГІНІ. Тобто гранична корисність, гранична норма заміщення тощо. З точки зору обчислення, економіка має справу з "першими" (і похідними вищого порядку).

Багато статистичних дисциплін займаються невихідними величинами, такими як засоби та дисперсії. Звичайно, ви можете зайти в область граничних та умовних розподілів ймовірностей, але деякі з цих додатків також переходять в економіку (наприклад, "очікувана величина")


2

Це не економетрика, це контекст. Якщо ваша імовірнісна функція не має єдиного оптимуму, це стосуватиметься як статистиків, так і економетриків. Тепер, якщо ви запропонуєте припущення, яке виходить з економічної теорії та обмежує параметризацію, щоб параметр був ідентифікований, це може бути названо економетрикою, але припущення могло прийти з будь-якого предметного поля.

Екзогенність - філософська справа. Див. Наприклад http://andrewgelman.com/2009/07/disputes_about/ для порівняння різних поглядів, де економісти зазвичай розуміють це так, як це робить Рубін.

Отже, коротко кажучи, або прийняти жаргон, який використовує ваш вчитель, або відкрито та читати широко.


2

Економетрики майже виключно зацікавлені у причинному висновку, тоді як статистики також використовують моделі для прогнозування результатів. Як результат, економетристи зосереджуються більше на екзогенності (як уже згадували інші). Економетрики зі зменшеною формою та структурні економетристи отримують цю причинну інтерпретацію по-різному.

Економетрики зі зменшеною формою часто мають справу з екзогенністю за допомогою інструментальних методів змінних (тоді як ІV статистики застосовуються набагато рідше).

Структурні економетрики отримують причинно-наслідкову інтерпретацію параметрів, спираючись на кількість теорії, яка є рідкісною в роботі статистиків.


1
IV використовується нестатистами, а економетрика зі зменшеною формою використовує безліч методів причинного висновку, відмінного від ІV (розрізнення в диференціалі, припинення регресії тощо). Дивіться цей документ Імбенса для узгодження економетрики IV з останніми нееконометричними статистичними подіями IV.
Арі Б. Фрідман

2

Як статистик я думаю про це в більш загальних рисах. У нас є біометрика та економетрика. Це обидва напрямки, де статистика використовується для вирішення проблем. З біометрикою ми маємо справу з біологічними / медичними проблемами, тоді як економетрика - з економікою. Інакше вони були б однаковими, за винятком того, що різні дисципліни підкреслюють різні статистичні прийоми. У біометрії широко використовуються аналіз виживання та аналіз таблиці надзвичайних ситуацій. Для економетрики сильно використовується часовий ряд. Регресійний аналіз є спільним для обох. Побачивши відповіді про термінологічні відмінності між економатрією та біостатистикою, здається, що актуальне питання стосувалося переважно термінології, і я насправді стосувався лише двох інших. Відповіді настільки хороші, що я нічого не можу додати до цього. Особливо мені сподобалися відповіді Стаска. Але як біостатист я думаю, що ми використовуємо модель Logit та логістичну модель взаємозамінно. Ми робимо виклик log (p / [1-p]) перетворення logit.


2
(+1) Ви можете додати психометрику до списку застосованих статистичних даних щодо конкретних доменів для вирішення конкретних проблем домену.
Енді Ш
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.