Я читав розділ " Аналіз даних та графіки" з кількома регресіями, використовуючи R: Приклад, заснований на прикладі, і трохи розгубився, дізнавшись, що він рекомендує перевірити наявність лінійних взаємозв'язків між пояснювальними змінними (використовуючи розсіювач) і, якщо таких немає " т будь-, перетворюючи їх таким чином , вони дійсно стають більш лінійно пов'язані. Ось кілька уривків із цього:
6.3 Стратегія встановлення множинних регресійних моделей
(...)
Вивчіть матрицю розсіювання за участю всіх пояснювальних змінних. (У тому числі залежна змінна на даний момент є необов'язковою. ) Спочатку шукайте докази нелінійності у графіках пояснювальних змінних один проти одного.
(...)
Цей момент визначає стратегію пошуку моделі - шукайте моделі, в яких регресійні зв’язки між пояснювальними змінними дотримуються "простої" лінійної форми . Таким чином, якщо деякі парні сюжети показують нелінійність, розгляньте можливість використання перетворень, щоб отримати більш майже лінійні співвідношення . Хоча, можливо, не обов'язково виявиться можливим, керуючись цією стратегією, адекватно моделювати регресійні відносини, але це є хорошою стратегією з причин, наведених нижче, що слід застосовувати при запуску пошуку.
(...)
Якщо зв'язки між пояснювальними змінними є приблизно лінійними, можливо, після перетворення, тоді можливо трактувати графіки змінних предиктора проти змінної відповіді.
(...)
Можливо, неможливо знайти перетворення однієї або декількох пояснювальних змінних, які забезпечують (попарно) співвідношення, показані на панелях, лінійними. Це може створити проблеми як для інтерпретації діагностичних графіків для будь-якого пристосованого рівняння регресії, так і для інтерпретації коефіцієнтів у пристосованому рівнянні. Дивіться Кука і Вайсберга (1999).
Чи не повинен я турбуватися про лінійні зв’язки між залежними змінними (через ризик мультиколінеарності), а не активно переслідувати їх? Які переваги мають приблизно лінійно пов'язані змінні?
Питання мультиколінеарності автори вирішують пізніше у розділі, але, здається, ці рекомендації не впадають у відповідь на те, щоб уникнути мультиколінеарності.