Регресія з оберненою незалежною змінною


10

Припустимо, у мене є вектор залежних змінних і вектор незалежної змінної. Коли побудовано проти , я бачу, що між ними існує лінійна залежність (тенденція до зростання). Тепер це також означає, що між і існує лінійна тенденція до зниження .Y N X Y 1NYNXY YX1XYX

Тепер, якщо я запускаю регресію: і отримую відповідне значенняY = β ХY=βX+ϵY^=β^X

Потім я запускаю регресію: і отримую відповідне значення ~ Y = α 1Y=α1X+ϵY~=α^1X

Чи будуть два прогнозовані значення і приблизно однакові? ~ YY^Y~

Відповіді:


10

 Коли Y побудовано проти , я бачу, що між ними існує лінійна залежність (тенденція до зростання). Тепер це також означає, що між Y і X існує лінійна тенденція до зниження1X

Останнє речення неправильне: є тенденція до зниження, але це аж ніяк не лінійно: Y ~ 1 / X Y ~ X

Я використав як функція плюс трохи шуму наY. Як бачите, будуючи графікYпроти1f(x)=1xYY дає лінійну поведінку,YпротиXдалеко не лінійна.1XYX

(@whuber вказує, що проти 1YСюжет X не виглядає гомоскедастичним. Я думаю, що, здається, є більша дисперсія для низькогоY,оскільки набагато більша щільність корпусу призводить до більшого діапазону, що по суті є тим, що ми сприймаємо. Насправді, дані є гомосептичними: я використовувавдля генерування даних, тому ніякої залежності від розміруX не було).1XYY = 1 / X + rnorm (length (X), sd = 0.1)X

Тож взагалі відносини дуже нелінійні. Тобто, якщо ваш діапазон є настільки вузьким, що ви можете наблизити d 1XОсь приклад:d1xdx=1x2const.

Y ~ 1 / X Y ~ X

Нижня лінія:

  • Взагалі, приблизно 1 важко наблизити функція за допомогою лінійної або поліноміальної функції. І без зміщення терміну ви ніколи не отримаєте розумного наближення.1X
  • Якщо інтервал досить вузький, щоб дозволити лінійне наближення, ви в будь-якому випадку не зможете з даних здогадатися, що співвідношення має бути 1X а не лінійний (X).1XX

YXY1/XYX

2
@whuber: Мені дуже шкода, але зараз, здається, досить щільно. Питання говорить: "Коли Y побудовано проти 1 / X, я бачу, що існує лінійна залежність (тенденція до зростання)". Ось що я намагався зобразити на 1-му та 3-му зображенні: Y над 1 / X лінійно збільшується. Потім я побудував відповідний Y над X (нелінійний, зменшується). Де я неправильно розумію ОП?
cbeleites незадоволений SX

1
Y1/X

Дякую за спостереження щодо гомоскедастичності. Перетворюючи незалежну змінну, ви не змінюєте гомоседастичності відповіді - але її поява, безумовно, може змінитися, як ви вказуєте, що корисно знати. (Ми спостерігали це явище в декількох інших постах, де люди неправильно приписують гетероскедастичність, наприклад, просто розбіжностям у групових групах населення)
whuber

Дуже ретельна відповідь та коментарі! Дякую @cbeleites та @whuber!
Mayou

2

Я не бачу причин, щоб вони взагалі були «приблизно рівними» - але що саме ви маєте на увазі під рівним?

Ось іграшковий приклад:

library(ggplot2)
n <- 10^3
df <- data.frame(x=runif(n, min=1, max=2))
df$y <- 5 / df$x + rnorm(n)
p <- (ggplot(df, aes(x=x, y=y)) +
      geom_point() +
      geom_smooth(method="lm", formula=y ~ 0 + x) +  # Blue, OP's y hat
      geom_smooth(method="lm", formula=y ~ 0 + I(x^-1), color="red"))  # Red, OP's y tilde
p

Фото:

Я б сказав, що це далеко не "приблизно рівні"

"Синя" модель зробила б набагато краще, якби дозволено мати перехоплюючий (тобто постійний) термін ...


Важко сказати, що ти робиш із синьою моделлю, але це, звичайно, не так, як описано в ОП! Червоний набагато ближче до ситуації, поданої у питанні.
whuber

Y1/XYXY1/X
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.