У мене є набір даних, що містить 365 спостереження за трьома змінними, а саме pm
, temp
і rain
. Тепер я хочу перевірити поведінку pm
у відповідь на зміни інших двох змінних. Мої змінні:
pm10
= Відповідь (залежно)temp
= предиктор (незалежний)rain
= предиктор (незалежний)
Далі наведена кореляційна матриця для моїх даних:
> cor(air.pollution)
pm temp rainy
pm 1.00000000 -0.03745229 -0.15264258
temp -0.03745229 1.00000000 0.04406743
rainy -0.15264258 0.04406743 1.00000000
Проблема полягає в тому, що коли я вивчав побудову регресійних моделей, було написано, що метод адиції починати зі змінної, яка найбільш сильно пов'язана зі змінною відгуку. У моєму наборі даних rain
дуже співвідноситься з pm
(порівняно з temp
), але в той же час це фіктивна змінна (дощ = 1, без дощу = 0), тож тепер у мене є підказки, з чого слід почати. Я доклав два зображення з питанням: Першим з них є розсіюванням даних, а друге зображенням є діаграмою розсіювання pm10
VS. rain
, я теж не в змозі інтерпретувати діаграму розсіювання pm10
VS. rain
. Може хтось допоможе мені, як почати?