Скажімо, у мене є такі дані та я використовую регресійну модель:
df=data.frame(income=c(5,3,47,8,6,5),
won=c(0,0,1,1,1,0),
age=c(18,18,23,50,19,39),
home=c(0,0,1,0,0,1))
З одного боку, я використовую лінійну модель для прогнозування доходу:
md1 = lm(income ~ age + home + home, data=df)
По-друге, я запускаю модель logit, щоб передбачити виграну змінну:
md2 = glm(factor(won) ~ age + home, data=df, family=binomial(link="logit"))
Для обох моделей мені цікаво, як я можу генерувати таблицю або кадр даних із категорією відповіді передбачувача, встановленим значенням та прогнозованим значенням моделі.
Отже, для лінійної моделі щось подібне:
age fitted_income predicted_income
18 3 5
23 3 3
50 4 2
19 5 5
39 6 4
home fitted_income predicted_income
0 5 6
1 3 9
Або, можливо, це має бути для кожної точки даних. Отже, для точки даних x_i встановлені та прогнозовані значення:
id age fitted_income predicted_income
1 18 3 5
2 23 3 3
3 50 4 2
4 19 5 5
5 39 6 4
З точки зору статистики, чи корисне таке підприємство? Чому чи чому б ні?
Як це можна зробити в R? (переглянув імена (md1) і виявив, що я можу витягнути з моделі, але не продовжував цього)
Дякую!
residuals
команду в R
. Використовуйте, cbind
щоб приєднати їх до початкового фрейму даних.