В даний час я використовую кілька лінійних моделей зі змішаним ефектом.
Я використовую пакет "lme4" в Р.
Мої моделі мають форму:
model <- lmer(response ~ predictor1 + predictor2 + (1 | random effect))
Перш ніж запускати свої моделі, я перевірив, чи можлива мультиколінеарність між предикторами.
Я зробив це:
Складіть кадр даних про прогнозистів
dummy_df <- data.frame(predictor1, predictor2)
Використовуйте функцію "cor", щоб обчислити співвідношення Пірсона між предикторами.
correl_dummy_df <- round(cor(dummy_df, use = "pair"), 2)
Якщо "correl_dummy_df" був більшим за 0,80, я вирішив, що preictor1 та predictor2 занадто сильно корелюються і вони не включаються до моїх моделей.
Коли я читаю, з’являються більш об'єктивні способи перевірити наявність мультиколінеарності.
Хтось має поради щодо цього?
"Фактор інфляції варіації (VIF)" здається одним із дійсних методів.
VIF можна обчислити, використовуючи функцію "corvif" в пакеті AED (не кривошип). Пакет можна знайти за адресою http://www.highstat.com/book2.htm . Пакет підтримує таку книгу:
Зуур, А.Ф., Ieno, EN, Walker, N., Saveliev, AA & Smith, GM 2009. Моделі та розширення змішаних ефектів в екології з R, 1-е видання. Спрінгер, Нью-Йорк.
Схоже, загальним правилом є те, що якщо VIF> 5, то між предикторами мультиколінеарність висока.
Чи використання VIF надійніше, ніж просте співвідношення Пірсона?
Оновлення
Я знайшов цікавий блог за адресою:
http://hlplab.wordpress.com/2011/02/24/diagnosing-collinenary-in-lme4/
Блогер надає корисний код для обчислення VIF для моделей з пакету lme4.
Я перевірив код, і він чудово працює. Під час наступного аналізу я виявив, що мультиколінеарність не є проблемою для моїх моделей (усі значення VIF <3). Це було цікаво, враховуючи, що я раніше знаходив високу кореляцію Пірсона між деякими прогнозами.
http://highstat.com/Books/BGS/GAMM/RCodeP2/HighstatLibV6.R
AED
Пакет було відмінено ; натомість простоsource("http://www.highstat.com/Book2/HighstatLibV6.R")
дляcorvif
функції. (2) Сподіваюсь надати справжню відповідь, але (а) Я вважаю, що VIF враховує мультиколінеарність (наприклад, у вас можуть бути три провідники, жоден з яких не має сильних парних кореляцій, але лінійна комбінація A і B сильно корелює з C ) і (б) у мене є сильні застереження щодо мудрості відмови від колінеарних термінів; див. Грем Екологія 2003, дой: 10.1890 / 02-3114