Існують деякі термінологічні відмінності, коли одне і те ж називається різними назвами в різних дисциплінах:
- Поздовжні дані в біостатистиці - це повторні спостереження одних і тих же осіб = панельні дані в економетриці.
- Модель для бінарної залежної змінної, в якій ймовірність 1 моделюється як , називається логіт-моделлю в економетрії, а логістичною моделлю в біостатистиці. Біостатистики прагнуть працювати з логістичною регресією за коефіцієнтом шансів, оскільки їх s часто є двійковими, тому коефіцієнти шансів представляють відносну частоту результату інтересу для двох груп населення. Це настільки поширена інтерпретація, що ви часто бачите суцільну змінну, перетворену на дві категорії (низький проти високого артеріального тиску), щоб полегшити цю інтерпретацію.1/(1+exp[−x′β])x
- "Оцінювальні рівняння" статистиків - це "моментні умови" економетриків. статистики - оцінки екстремуму економетриків.M
Існують термінологічні відмінності, коли один і той же термін використовується для позначення різних речей у різних дисциплінах:
- Фіксовані ефекти означають в рівнянні регресії для статистиків ANOVA, а для економетриків - оцінку "всередині".x′β
- Надійний висновок означає, що для економістів (з розширеннями на кластеризовані стандартні помилки та / або стандартні помилки з виправленням автокореляції) виправлені стандартні помилки, що виправляються гетерокедастичністю, та методи, які є надійними для далеких людей, які не відповідають сталим статистикам.
- Схоже, економісти мають смішне уявлення, що стратифіковані зразки - це ті, у яких ймовірність відбору змінюється між спостереженнями. Їх слід назвати неоднаковими зразками ймовірності. Стратифіковані зразки - це ті, у яких сукупність розбивається на заздалегідь визначені групи за характеристиками, відомими до того, як відбудеться відбір проб.
- "Оцінка даних" економетриків (принаймні в літературі 1980-х років) означала багаторазове тестування і пов'язані з цим підводні камені, які були чудово пояснені в книзі Гаррелла . Процедури видобутку даних комп'ютерних вчених (і статистиків) - непараметричні методи пошуку шаблонів даних, також відомі як статистичне навчання .
Я бачу унікальний внесок економетрики
- Способи боротьби з ендогенністю та погано заданими регресійними моделями, визнаючи, як mpiktas пояснив в іншій відповіді , що (i) пояснювальні змінні можуть самі бути випадковими (і, отже, корелювати з помилками регресії, що створюють зміщення в оцінках параметрів), (ii) моделі можуть страждати від опущених змінних (які потім стають частиною терміна помилки); (iii) може спостерігатися непомічена неоднорідність того, як економічні агенти реагують на стимули, тим самим ускладнюючи стандартні моделі регресії. Angrist & Pischke - чудовий огляд цих питань, і статистики дізнаються багато нового про те, як зробити з нього регресійний аналіз. Принаймні, статистикам слід вивчити і зрозуміти регресію інструментальних змінних.
- Загалом, економісти хочуть зробити якомога менше припущень щодо своїх моделей, щоб переконатися, що їхні висновки не залежать від чогось такого смішного, як багатоваріантна нормальність. Ось чому ГММ користується величезною популярністю у економістів і ніколи не потрапляє в статистику (хоча Фергюсон був описаний як мінімум наприкінці 1960-х). Ось чому прийняття емпіричної ймовірності зростало експоненціально в економетрії, але лише в статистиці мало. Ось чому економісти ведуть свою регресію з "надійними" стандартними помилками, а статистики - зі стандартними помилками OLS .χ2s2(X′X)−1
- У часовій області було багато роботи з регулярно розподіленими процесами - ось так збираються макроекономічні дані. Унікальний внесок включає інтегровані та коінтегровані процеси та методи авторегресивної умовної гетероскедастичності ((G) ARCH). Я, як правило, мікросуб'єкт, я з ними менш знайомий.
В цілому економісти прагнуть шукати сильної інтерпретації коефіцієнтів у своїх моделях. Статистики використовуватимуть логістичну модель як спосіб дійти до ймовірності позитивного результату, часто як простий прогнозний пристрій, а також можуть відзначити інтерпретацію GLM з приємними експонентними сімейними властивостями, якими він володіє, а також зв’язки з дискримінантним аналізом. Економісти думають про корисність інтерпретації моделі logit і будуть стурбовані тим, що в цій моделі ідентифікується лише , і що гетерокедастичність може її скинути. (Статистикам буде цікаво, щоβ/σσ Звичайно, економісти говорять про економістів.) Звичайно, утиліта, яка є лінійною у своїх входах, є дуже смішною річчю з точки зору мікроекономіки 101, хоча деякі узагальнення на напіввігнуті функції, ймовірно, зроблені в Мас-Колле.
Те, що економісти, як правило, пропускають, але, IMHO, виграло б, це аспекти багатоваріантного аналізу (включаючи приховані змінні моделі як спосіб боротьби з помилками вимірювань та численними проксі-серверами ... статистики, однак, не звертають уваги на ці моделі) , регресійна діагностика (усі ці відстані Кука, C_pCp, DFBETA та ін.), Аналіз відсутніх даних (часткова ідентифікація Манського, безумовно, фантазія, але корисніше розбиття MCAR / MAR / NMAR та багаторазова імпутація), а також статистика опитування. Дуже багато інших внесків з основних статистичних даних розважали економетрикою і приймали або як стандартну методологію, або передавали її як короткочасну модель: моделі ARMA 1960-х років, ймовірно, більш відомі в економетрії, ніж у статистиці, як деякі програми випускників в статистиці може не запропонувати курс часових рядів у ці дні; оцінювачі усадки / регресія хребта 1970-х років прийшли і пішли; черевик 1980-х років - це реакція на коліна в будь-яких складних ситуаціях, хоча економістам потрібно краще усвідомлювати обмеження завантажувальної програми; емпірична ймовірність 90-х років бачила більше розробки методології у теоретичних економетриків, ніж у теоретичних статистиків; обчислювальні байєсівські методи 2000-х років розважаються в економетрії, але я вважаю, що вони занадто параметричні, занадто сильні на основі моделей, щоб бути сумісними з парадигмою стійкості, про яку я згадував раніше. Незалежно від того, чи знайдуть економісти використання статистичного навчання / біоінформатики чи просторово-часових речей, які надзвичайно гарячі в сучасній статистиці, це відкритий заклик.