Проблема мультиколінеарності добре вивчена у фактично більшості економетричних підручників. Більше того, є добра стаття у Вікіпедії, яка фактично резюмує більшість ключових питань.
ХТХ
- великі зміни в оцінках параметрів під час виконання регресії кочення або оцінок на менших підпроборах даних
- тЖ
- R2
- Індекс умови є альтернативою VIF, у вашому випадку ні VIF, ні CI не показують, що проблема не залишається, тому ви можете бути статистично задоволені цим результатом, але ...
певно, теоретично, оскільки може трапитися (і зазвичай це так), що вам потрібно, щоб усі змінні були присутні в моделі. Виключення відповідних змінних (проблема опущеної змінної) все одно зробить упереджені та непослідовні оцінки параметрів. З іншого боку, вас можуть змусити включати всі змінні фокусу просто тому, що ваш аналіз заснований на ньому. У підході до вибору даних, хоча ви більш технічні в пошуку найкращого підходу.
Тож пам’ятайте про альтернативи (якими я б користувався сам):
- отримати більше точок даних (нагадаємо, що вимоги VIF менші для більшого набору даних, а пояснювальні змінні, якщо вони повільно змінюються, можуть змінюватись для деяких вирішальних моментів часу або перерізу)
- пошук латентних факторів за допомогою основних компонентів (останні є ортогональними комбінаціями, тому не будують багатоколінійною побудовою, більше включають усі пояснювальні змінні)
- ridge-регресія (вона вводить невеликі зміщення в оцінки параметрів, але робить їх високостійкими)
Деякі інші хитрощі є у статті, що зазначається у вікі, зазначеній вище.