Яке інтуїтивне значення має лінійний зв’язок між журналами двох змінних?


20

У мене є дві змінні, які не показують особливої ​​кореляції, коли будуються одна проти одної, але дуже чітке лінійне співвідношення, коли я будую журнали кожної змінної, починаючи з іншої.

Тому я закінчую модель типу:

log(Y)=alog(X)+b
, що є великим математично, але, схоже, не має пояснювального значення звичайної лінійної моделі.

Як можна інтерпретувати таку модель?


5
Я не маю нічого суттєвого додати до існуючих відповідей, але логарифм результату та прогноз - це еластичність. Пошуки цього терміна повинні знайти хороші ресурси для інтерпретації цих відносин, що не дуже інтуїтивно.
Upper_Case-Stop Шкодить Моніці

Інтерпретація моделі log-log, де залежною змінною є log (y), а незалежною змінною є log (x), є: %Δ=β1%Δx .
Боб

3
Додаткове посилання-журнал-журнал є ідеальною специфікацією GLM, коли результат є двійковим (модель ризику) та вплив є кумулятивним, наприклад, кількість сексуальних партнерів проти ВІЛ-інфекції. jstor.org/stable/2532454
AdamO

2
@Alexis ви можете побачити липкі точки, якщо перекривати криві. Спробуйте curve(exp(-exp(x)), from=-5, to=5)проти curve(plogis(x), from=-5, to=5). Увігнутість прискорюється. Якщо ризик події від однієї зустрічі був p , то ризик після другої події повинен бути 1(1p)2 і так далі, це імовірнісна форма logit не буде захоплена. Високі високі експозиції призведуть до більш різких результатів логістичної регресії (помилково відповідно до попереднього правила ймовірності). Деяке моделювання показало б вам це.
AdamO

1
@AdamO Напевно, має бути написаний педагогічний документ, що містить таке моделювання, яке мотивує, як вибрати певний дихотомічний зв'язок результату з трьох, включаючи ситуації, коли це не робить і не має значення.
Олексій

Відповіді:


27

Вам просто потрібно взяти експоненцію обох сторін рівняння, і ви отримаєте потенційне відношення, яке може мати сенс для деяких даних.

log(Y)=alog(X)+b

exp(log(Y))=exp(alog(X)+b)

Y=ebXa

А оскільки - просто параметр, який може приймати будь-яке додатне значення, ця модель еквівалентна:eb

Y=cXa

Слід зазначити, що вираз моделі повинен включати термін помилки, і ці зміни змінних мають на неї цікавий вплив:

log(Y)=alog(X)+b+ϵ

Y=ebXaexp(ϵ)

Тобто ваша модель з додатковою помилкою, що дотримується умов OLS (нормально розподілені помилки з постійною дисперсією) еквівалентна потенційній моделі з мультиплікативними помилками, логарифма яких відповідає нормальному розподілу з постійною дисперсією.


3
ОП може бути зацікавлене знати, що цей дистрибутив має назву, log-normal: en.wikipedia.org/wiki/Log-normal_distribution
gardenhead

2
Як щодо ефекту нерівності Дженсена? Як правило, для опуклих g,E[g(X)]g(E[X])
статистика

14

Ви можете взяти модель і обчислити загальний диференціал, ви отримаєте щось на зразок: який поступається журнал(Y)=ажурнал(Х)+б

1YгY=а1ХгХ
гYгХХY=а

Отже , один проста інтерпретація коефіцієнта буде процентним зміною в для процентного зміни в . З цього випливає , крім того , що змінна нарости на постійній фракції ( ) від швидкості росту .аYХYa XаХ


Отже, якщо графік журналу журналу лінійний, це означатиме постійний темп зростання?
Мастеров Димитрій Васильович

Насправді швидкість росту буде постійною тоді і лише тоді, коли . a = 0Yа=0
RScrlli

Не з часом швидкість зростання відносно приросту в х.
Мастеров Димитрій Васильович

упорядкування не допомагає, я б його видалив
Аксакал,

1
@ DimitriyV.Masterov Ok, то так як , лінійний по , це означає , що змінна зростає при постійній частці швидкості росту . Чи щось не так у моїй відповіді згідно з вами? log ( X ) Y Xжурнал(Y)журнал(Х)YХ
RScrlli

7

Інтуїтивно задає нам порядок величини змінної, тому ми можемо розглянути співвідношення як порядки величин двох змінних лінійно пов'язані. Наприклад, збільшення прогноктора на один порядок може бути пов'язане зі збільшенням на три порядки величини відгуку.журнал

Складаючи схему за допомогою графіку журналу журналу, ми сподіваємось побачити лінійну залежність. На прикладі цього питання ми можемо перевірити припущення лінійної моделі:

log-log


3
+1 за інтуїтивну відповідь на неінтуїтивну концепцію. Однак зображення, яке ви включили, явно порушує постійну дисперсію помилок у прогнозі.
Франс Роденбург

1
Відповідь правильна, але авторська атрибуція неправильна. Зображення не слід позначати на зображеннях Google, а принаймні на веб-сторінці, де його можна знайти, про що можна дізнатися лише натиснувши зображення Google.
Пер

@ На жаль, я не можу знайти оригінальне джерело зображення на жаль (принаймні, використовуючи зворотний пошук зображень)
qwr

Здається, він походить з diagramss.us, хоча цей веб-сайт не працює, і більшість його сторінок немає у веб-архіві, окрім його домашньої сторінки
Генріх

4

Погоджуючи відповідь @Rscrill з фактичними дискретними даними, врахуйте

журнал(Yт)=ажурнал(Хт)+б,журнал(Yт-1)=ажурнал(Хт-1)+б

журнал(Yт)-журнал(Yт-1)=а[журнал(Хт)-журнал(Хт-1)]

Але

журнал(Yт)-журнал(Yт-1)=журнал(YтYт-1)журнал(Yт-1+ΔYтYт-1)=журнал(1+ΔYтYт-1)

ΔYтYт-1 - процентна зміна між періодами і , або швидкість росту , скажімо . Коли вона менше , ми маємо, що прийнятне наближення єYт-1тYтгYт0,1

журнал(1+ΔYтYт-1)ΔYтYт-1=гYт

Тому ми отримуємо

гYтагХт

що підтверджує в емпіричних дослідженнях теоретичне лікування @Rscrill.


1
Це, мабуть, математик би назвав інтуїтивно зрозумілим :)
Річард Харді

2

Лінійна залежність між журналами рівнозначна залежності від сили потужності : У фізиці така поведінка означає, що система є вільною від масштабу або інваріантною за шкалою . Наприклад, якщо - відстань або час, це означає, що залежність від не може бути охарактеризована характерною довжиною або часовою шкалою (на відміну від експоненціальних розпадів). В результаті, така система має далекої залежністю на .

YХα
X X Y XХХYХ

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.