Відмова: Це для домашнього завдання.
Я намагаюся придумати найкращу модель для ціни на алмази, залежно від кількох змінних, і, здається, поки що у мене досить гарна модель. Однак я зіткнувся з двома змінними, які, очевидно, колінеарні:
>with(diamonds, cor(data.frame(Table, Depth, Carat.Weight)))
Table Depth Carat.Weight
Table 1.00000000 -0.41035485 0.05237998
Depth -0.41035485 1.00000000 0.01779489
Carat.Weight 0.05237998 0.01779489 1.00000000
Таблиця та Глибина залежать один від одного, але я все ж хочу включити їх до своєї прогнозної моделі. Я провів кілька досліджень алмазів і виявив, що Таблиця і Глибина - це довжина вгорі і відстань від верху до низу кінчика алмаза. Оскільки ці ціни на алмази, схоже, пов'язані з красою та красою, схоже, пов'язані між собою пропорціями, я збирався включити їх співвідношення, скажімо , щоб передбачити ціни. Це стандартна процедура поводження з колінеарними змінними? Якщо ні, що таке?
Редагувати: Ось графік глибини ~ Таблиця: