Я б запропонував для початку короткий пошук " діагностики лінійної регресійної моделі ". Але ось кілька, які я б запропонував вам перевірити:
Переконайтеся, що припущення задоволено
Використовуйте розсіювач або компонент плюс залишковий графік, щоб вивчити лінійну залежність між незалежними прогнокторами та залежною змінною.
Складіть графік із стандартизованою залишковою та прогнозованою величиною та переконайтесь, що не існує крайньої точки з дуже високою залишковою здатністю, а поширення залишків значною мірою подібне по прогнозованому значенню, а також поширюється значною мірою однаково вище середнього та нижче середнього залишку, нуль.
Ви також можете змінити вісь y на залишкову . Цей сюжет допомагає виявити неоднакову дисперсію.2
Перегляньте проект дослідження, щоб переконатися, що здобуття незалежності є розумним.
Отримайте статистику коефіцієнта дисперсії дисперсії (VIF) або статистику толерантності для вивчення можливої колінеарності.
Вивчити потенційні впливові точки
- Перевірте такі статистичні дані, як D, DFits або DF Beta, щоб дізнатися, чи певна точка даних різко змінює ваші результати регресії. Більше ви можете знайти тут .
Вивчіть зміну статистики та скориговану статистикуR 2R2R2
- Будучи відношенням регресійної суми квадратів до загальної суми квадратів, може сказати вам, скільки відсотків змінності вашої залежної змінної пояснюється моделлю.R2
- Відрегульований може бути використаний для перевірки, чи дійсна додаткова сума квадратів, приведених моїми додатковими передбачувачами, дійсно варті тих ступенів свободи, які вони візьмуть.R2
Перевірте необхідну взаємодію
- Якщо є головний незалежний предиктор, перш ніж робити будь-яку інтерпретацію його незалежного ефекту, перевірте, чи він взаємодіє з іншими незалежними змінними. Взаємодія, якщо її не змінити, може змінити вашу оцінку.
Застосуйте вашу модель до іншого набору даних і перевірте її продуктивність
- Ви також можете застосувати формулу регресії до інших окремих даних і побачити, наскільки добре вона прогнозує. Такий графік, як графік розкидання та статистика, як% різниця від спостережуваного значення, може послужити хорошим початком.
r-squared
тег іgoodness-of-fit
тег ..