Економетрика: Чи є еластичним значення в моєму, або будь-якому, регресії?


13

Кілька місяців тому я стажувався в цій організації; і, будучи подарунком, що відходить, я вирішив провести свій останній тиждень, у будь-який час, який у мене був, на дослідження факторів, які впливають на зарплату вчителів. Одна з проблем, з якою я стикався із зарплатою вчителів, полягала в тому, що розподіл за цією державою було перекрученим. У мене було багато спостережень, які чіплялися до нижнього кінця спектру заробітної плати. Я спробував це вирішити, включивши порівняльний індекс заробітної плати у свою залежну змінну (заробітна плата вчителів), але результати, які я знайшов, повністю застаріли в рамках мого проекту. Я замість цього вирішив записати свою залежну змінну. Це було приємно, бо зараз моя зарплата мала нормальний розподіл, і це просто виглядало ідеально в гістограмі. Коли я почав перевіряти, я дійшов до того, що мені залишилася остання незалежна змінна декларація з податку на нерухомість. Проблема з моєю нормативною заробітною платою виявилася і в моїх спостереженнях щодо декларації з податку на майно. У мене був величезний перекіс номерів декларацій з податку на нерухомість у нижній частині спектра. Отже, я зареєстрував цю змінну також, і вона все одно пройшла тест нульової гіпотези.

Я не впевнений, чи правильно це правильно, але порівняння зміни однієї зареєстрованої змінної на іншу змінна, що входила в систему, надала мені еластичності. Якщо припустити, що це правильно, моє рівняння регресії (щось на зразок LogWages = B0 + B1 (LogPropertyTaxReturns)) показує еластичність між двома змінними. Невже це має сенс? Якщо моя мета полягала в тому, щоб визначити, яка змінна найбільше вплинула на зарплату вчителів у будь-якому окрузі моєї штату, то корисність показу еластичності між цими двома змінними? Ми хочемо підвищити округи з найнижчою зарплатою вчителів до більш високих, щоб підвищити рівень їх життя, але я боюся, що я екстраполювався так далеко від реальних спостережень, що моє заключне регресійне рівняння є безглуздим.

Редагувати: Один з моїх більших страхів - це те, що я повинен був використовувати нелінійну модель, щоб показати стосунки. Я вважаю, що примусити і залежну, і незалежну змінну до співпраці в цій лінійній регресії певним чином вводити в оману.


1
Це абсолютно значуще. Подивіться на визначення пружності. Ви в основному маєте інформацію про напрямок взаємозв'язку між заробітною платою та PropertyTaxReturns. Більше того, у вас є приблизна міра цих відносин. Оскільки це Log-Log, заробітна плата зміниться на 1 відсоток зміни декларації з податку на нерухомість. Ви можете зробити аналіз часових рядів, щоб підтвердити це. Насправді, лише графік зарплати та декларації з податку на нерухомість з часом було б достатньо, щоб зрозуміти, які стосунки є. Це основний спосіб, який не враховує приховані змінні та ін.
Коба

@Koba Дякую за коментар так швидко. Хіба не проблема, хоча еластичність змінюється по кривій? Моє найбільше жаль, що я, можливо, змусив модель бути лінійною, змусивши еластичність бути досить стійкою. Роздумуючи назад, можливо, насправді було б краще мати нелінійну модель, яка б відображала цей перекіс, про який я говорив.
rosenjcb

Немає нічого поганого в перетворенні змінних за допомогою журналу, квадратного кореня, реципрок або інших методів. Ти нічого не змушуєш. Ви використовуєте перетворення, щоб знайти лінійну залежність між змінними. Іноді це просто, як ви просто використовуєте y = b0 + b1 * x. Інші часові змінні лінійно пов'язані більш складним способом, наприклад, наприклад, log (y) = b0 + b1 * (1 / x). Остання функція може дати вам хороші лінійні відносини, але це важче інтерпретувати, тому чим менше перетворень ви можете використовувати, тим краще.
Коба

Функція журналу журналу - це досить простий журнал (y) = b0 + b1 * log (x). B1 - це якраз відсоткова зміна y на один відсоток зміна x у вашому аналізі поперечного перерізу. Знову ж таки, якщо у вас є ці дані протягом певного періоду часу, ви можете просто графікувати їх, щоб побачити взаємозв'язок.
Коба

Я реєстрував змінні раніше і робив інші перетворення для моїх регресійних моделей. Мене просто хвилювало, що еластичність видає привід зустрічі. Хоча, задумуючись, модель була лінійною, вона просто мала проблему наявності залежних та незалежних змінних із перекошеними розподілами.
rosenjcb

Відповіді:


12

Відповідь на питання - це так, вона справді осмислена (принаймні математично кажучи). Якщо оцінити лінійне рівняння

W=β0+β1PTR,

потім , що означає , що представляє граничне зміна над . Тепер, якщо ви оціните β1PTRWβ1=WPTRβ1PTRW

log(W)=β0+β1log(PTR),

то , що є самим визначенням пружності.β1=WPTRPTRW

Взагалі лінійні перетворення впливають лише на інтерпретацію, задану коефіцієнтами, але обгрунтованість самої регресії (в широкому економічному плані) визначається припущеннями моделі та економічними явищами, що аналізуються.


8

Як і люди говорили в коментарях, лог-журнал зазвичай використовується. Це означає оцінку моделі постійної еластичності , яка є загальновживаною функціональною формою в економіці. Після того, як ви берете журнали, це стає . Більше про це можна прочитати тут .Y=αXβlnY=lnα+βlnX

Я думаю, ваше питання полягає в тому, чи має використання цієї функціональної форми сенс у вашій конкретній моделі. Важко сказати. Як і у будь-якій звичайній лінійній регресії, ви робите припущення про функціональну форму. Ви можете принаймні просто думати про це як про лінійне наближення, яке має більше сенсу після перетворення журналу журналу.


7

Добре, що інші респонденти досить добре висвітлювали логіку регресії журналу журналу, тому я просто збираюся додати кілька практичних порад. Якщо ви хочете перевірити, чи є ваша специфікація розумною, а ваша проблема полягає в припущенні постійної еластичності, спробуйте розділити вибірку на групи на основі відсотків і перерахувати і . Потім подивіться, наскільки вони відрізняються. Ви можете навіть зробити це, використовуючи манекени та умови взаємодії для кожного з відсотків, а потім використати тест для визначення спільної значущості термінів взаємодії. Іншими словами: деα β F log y i = α + β log x i + S j = 2 γ j χ j + λ j χ j log x i χ j γ λxαβF

logyi=α+βlogxi+j=2Sγjχj+λjχjlogxi
χj- це ваша процентна манекен. Потім перевірте, чи є та спільно значущими. Це аж ніяк не формально , але це може дати вам приблизне уявлення про те, наскільки розумним є постійний пружність.γλ

Зауважте, що як уявлення про "справжнє" основне рішення, прийняття всіх перетворень, що призводять до лінійної регресії, є помилковим. Насправді, всі моделі будуть помилятися. Питання справді: чи корисна статистика, отримана від цієї моделі, для вашої проблеми ? Якщо ваше дослідження зосереджене на визначенні основної моделі, це момент, який розповість вам щось цікаве про цю глибшу модель? Якщо ви більше орієнтовані на політику, чи наближення з постійною еластичністю наблизиться до істини, що подальше вдосконалення не має значення? На питання зовнішнього спостерігача можна відповісти на надзвичайно важкі питання. Але якщо єдиною альтернативою, яка вас хвилює, є змінна еластичність, то вигляд, який я виклав вище, може дати вам спокій.


4

Інші відповіді охоплювали основні питання, я хотів би відповісти на "Редагування", зроблене ОП у запитанні:

Редагувати: Один з моїх більших страхів - це те, що я повинен був використовувати нелінійну модель, щоб показати стосунки. Я вважаю, що примусити і залежну, і незалежну змінну до співпраці в цій лінійній регресії певним чином вводити в оману.

Ми зазвичай забуваємо, що "перетворення змінної" призводить до нової змінної , поведінка якої може бути абсолютно іншою, ніж "оригінальна". Найпростіший приклад - порівняння графіків змінної та її квадрата.

Таким чином , з урахуванням натуральних логарифмів вашого змінними, більше не розглядати в стосунках між ними , але в зв'язку між деякою функцією з них.
Це пощастило , що математичне поняття «логарифм» може бути пов'язана з поняттям «пружності», яка описує взаємозв'язок між змінами процентних, що - то ми розуміємо , з економічної точки зору , і ми можемо осмислено інтерпретувати і використовувати.

Якщо можна змістовно сказати, що змінні демонструють "лінійну залежність у логарифмах", це означає, що їх рівні (тобто фактичні змінні) мають нелінійне відношення:

lnya+blnxyea+xb

То чому б не оцінити нелінійну модель?
У (математичному) принципі немає причини, чому б ні. Деякі практичні питання:

1) Занадто багато форм нелінійних зв’язків, є лише одна лінійна залежність (структурно кажучи). Це питання "витрат на пошук" для найбільш підходящої специфікації.

2) Отримане нелінійне співвідношення може не мати чіткого економічного пояснення. Чому це проблема? Тому що ми не розкриваємо тут «закони природи», незмінні через час та простір. Ми наближаємось до соціального явища. Наближення, яке, крім того, може бути представлене лише як математична формула, без економічних міркувань, які підтверджують та підтримують, робить результат дуже тонким.

3) Нелінійна оцінка менш стабільна, що стосується механіки алгоритму оцінки.


3

Я б сказав, що ваша модель в цьому випадку не здається осмисленою, якщо ваша " мета полягала в тому, щоб визначити, яка змінна найбільше вплинула на зарплату вчителів у будь-якому районі моєї держави ". Ви щойно показали, яке співвідношення між (журналами) заробітної плати та деклараціями з податку на майно. Вам слід принаймні скористатися множинною регресією.

Звичайно, ви можете продовжувати розробляти повноцінну, належну ідентифікаційну стратегію з відповідними методологічними інструментами для того, щоб оцінити інтенсивність кожного причинного ефекту і знайти найбільшу ... Насправді ви, швидше за все, не зможете зробити це з огляду на складність такого завдання. Це просто континуум уточнення, і ви поруч із найрізноманітнішою можливою моделлю, що використовується для пояснення зарплати, дуже далекої від того, що я вважав би прийнятним наближенням відповіді на питання, неявне у вашій меті. Вам слід спробувати заручитися допомогою економетра.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.