Варіантно-коваріаційна інтерпретація матриці


12

Припустимо, у нас є лінійна модель Model1і vcov(Model1)дає таку матрицю:

             (Intercept)    latitude  sea.distance   altitude
(Intercept)    28.898100 -23.6439000  -34.1523000  0.50790600
latitude      -23.643900  19.7032500   28.4602500 -0.42471450
sea.distance  -34.152300  28.4602500   42.4714500 -0.62612550
altitude        0.507906  -0.4247145   -0.6261255  0.00928242

Для цього прикладу, що насправді відображає ця матриця? Які припущення ми можемо сміливо зробити для нашої моделі та незалежних змінних?

Відповіді:


11

Ця матриця відображає оцінки дисперсії та коваріації між коефіцієнтами регресії. Зокрема, для вашої проектної матриці та оцінки дисперсії ваша відображена матриця - .Xσ^2σ^2(XX)1

Діагональні записи - це дисперсія коефіцієнтів регресії, а позадіагоналі - коваріація між відповідними коефіцієнтами регресії.

Що стосується припущень, застосуйте функцію cov2cor () до вашої матриці дисперсії-коваріації. Ця функція перетворить задану матрицю в матрицю кореляції. Ви отримаєте оцінки співвідношень коефіцієнтів регресії. Підказка: для цієї матриці кожна кореляція матиме великі величини.

Щоб сказати щось про модель, зокрема, нам потрібні точкові оцінки коефіцієнтів регресії, щоб сказати що-небудь далі.


11

@Donnie дав хорошу відповідь (+1). Дозвольте додати ще пару балів.

Збіг основної діагоналі матриці дисперсії-коваріації - це відхилення розподілу вибірки ваших оцінок параметрів (тобто 's). Таким чином, взяття квадратних коренів цих значень дає стандартні помилки, про які повідомляється зі статистичним результатом: β^j

SEs   = sqrt(diag(vcov(Model1)))
SEs
# [1] 5.37569530 4.43883431 6.51701235 0.09634532

Вони використовуються для формування інтервалів довіри та перевірки гіпотез про ваші бета-версії.

Позадіагональних елементів було б якби всі змінні були ортогональними, але ваші значення далекі від . Використання функції або стандартизація коваріацій квадратними коренями складових варіабельних варіацій виявляє, що всі змінні сильно корелюються ( ), тому у вас є значна мультиколінеарність . Це робить ваші стандартні помилки набагато більшими, ніж вони були б інакше. Так само це означає, що існує велика кількість інформації про розподілі вибірки бета-версій, яка залишається поза стандартними тестами гіпотез ( ), тому ви можете скористатись послідовна стратегія тестування, заснована на сумах квадратів I типу . 00cov2cor()|r|>.97β^j/SE(β^j)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.