Я дізнався, що, використовуючи vif()метод carпакету, ми можемо обчислити ступінь мультиколінеарності вхідних даних у моделі. З вікіпедії , якщо vifзначення більше, ніж 5тоді, ми можемо вважати, що вхід страждає від проблеми мультиколінеарності. Наприклад, я розробив лінійну регресійну модель за допомогою lm()методу і vif()дає наступне. Як ми можемо бачити, входи ub, lbі tbстраждають від мультиколінеарності.
vif(lrmodel)
tb ub lb ma ua mb sa sb
7.929757 50.406318 30.826721 1.178124 1.891218 1.364020 2.113797 2.357946
Для того , щоб уникнути проблем мультіколлінеарності і , таким чином , щоб зробити мою модель більш стійкою, я прийняв взаємодія ubі lb, і тепер VIF стіл нової моделі виглядає наступним чином :
tb ub:lb ma mb sa sb ua
1.763331 1.407963 1.178124 1.327287 2.113797 1.860894 1.891218
Немає великої різниці у R^2значеннях, а також немає великої різниці в помилках від тестів, що залишаються одноразово, а також у обох вищезазначених випадках.
Мої запитання:
Чи добре уникати проблеми мультиколінеарності, приймаючи взаємодію, як показано вище?
Чи є кращий спосіб представити проблему мультиколінеарності порівняно з результатами вищезгаданого методу vif.
Надайте, будь ласка, свої пропозиції.
Дякую.