Я дізнався, що, використовуючи vif()
метод car
пакету, ми можемо обчислити ступінь мультиколінеарності вхідних даних у моделі. З вікіпедії , якщо vif
значення більше, ніж 5
тоді, ми можемо вважати, що вхід страждає від проблеми мультиколінеарності. Наприклад, я розробив лінійну регресійну модель за допомогою lm()
методу і vif()
дає наступне. Як ми можемо бачити, входи ub
, lb
і tb
страждають від мультиколінеарності.
vif(lrmodel)
tb ub lb ma ua mb sa sb
7.929757 50.406318 30.826721 1.178124 1.891218 1.364020 2.113797 2.357946
Для того , щоб уникнути проблем мультіколлінеарності і , таким чином , щоб зробити мою модель більш стійкою, я прийняв взаємодія ub
і lb
, і тепер VIF стіл нової моделі виглядає наступним чином :
tb ub:lb ma mb sa sb ua
1.763331 1.407963 1.178124 1.327287 2.113797 1.860894 1.891218
Немає великої різниці у R^2
значеннях, а також немає великої різниці в помилках від тестів, що залишаються одноразово, а також у обох вищезазначених випадках.
Мої запитання:
Чи добре уникати проблеми мультиколінеарності, приймаючи взаємодію, як показано вище?
Чи є кращий спосіб представити проблему мультиколінеарності порівняно з результатами вищезгаданого методу vif.
Надайте, будь ласка, свої пропозиції.
Дякую.