Пропоновані відповіді дають мені кілька ідей щодо того, що тут відбувається. Я вірю, що випадково були допущені помилки. Подивіться, чи має сенс наступна історія: Для початку, я думаю, існує велика взаємозв’язок між даними X&Y (ось деякий код та сюжет):
set.seed(5)
wage <- rlnorm(1000, meanlog=2.3, sdlog=.5)
something_else <- .7*wage + rnorm(1000, mean=0, sd=1)
plot(wage, something_else, pch=3, col="red", main="Plot X vs. Y")
Але помилково Y передбачили просто із середнього значення. У поєднанні з цим залишки від середньої моделі побудовані проти X, хоча те, що було призначено, було побудувати проти встановлених значень (код і графік):
meanModel <- lm(something_else~1)
windows()
plot(wage, meanModel$residuals, pch=3, col="red",
main="Plot of residuals from Mean only Model against X")
abline(h=0, lty="dotted")
Ми можемо це виправити, встановивши відповідну модель та побудувавши із неї залишки (код та графік):
appropriateModel <- lm(something_else~wage)
windows()
plot(appropriateModel$fitted.values, appropriateModel$residuals, pch=3, col="red",
main="Plot of residuals from the appropriate\nmodel against fitted values")
lines(lowess(appropriateModel$residuals~appropriateModel$fitted.values))
Це здається лише типом приховань, які я робив, коли починав.