Яка інтерпретація коваріації коефіцієнтів регресії?


13

Функція lm в R може роздрукувати оцінену коваріацію коефіцієнтів регресії. Що дає нам ця інформація? Чи можемо ми зараз краще інтерпретувати модель або діагностувати проблеми, які можуть бути присутніми в моделі?


1
Та сама інтерпретація, як і всі інші коваріації --- лінійна коваріація? Основне використання полягає в обчисленні дисперсії вибраних контрастів, що цікавлять, наприклад, для перевірки контрастів.
kjetil b halvorsen

Відповіді:


20

Найбільш основне використання коваріаційної матриці - це отримання стандартних помилок регресійних оцінок. Якщо дослідника цікавлять лише стандартні помилки самих окремих параметрів регресії, вони можуть просто взяти квадратний корінь діагоналі, щоб отримати окремі стандартні помилки.

Однак часто вас може зацікавити лінійна комбінація параметрів регресії. Наприклад, якщо у вас є змінна індикатора для даної групи, вас може зацікавити середнє значення групи, яке б було

.β0+βгrp

Тоді, щоб знайти стандартну помилку для оціночного середнього значення для цієї групи, ви мали б

,ХSХ

де - вектор ваших контрастів, а S - матриця коваріації. У нашому випадку, якщо ми маємо лише додавання коваріату "grp", то X = ( 1 , 1 ) ( 1 для перехоплення, 1 для належності до групи).ХSХ=(1,1)11

Крім того, матриця коваріації (або більше, кореляційна матриця, яка однозначно ідентифікована з коваріаційної матриці, але не навпаки) може бути дуже корисною для певної діагностики моделі. Якщо дві змінні сильно корелюються, один із способів подумати про це полягає в тому, що в моделі виникають труднощі з'ясувати, яка змінна відповідає за ефект (оскільки вони так тісно пов'язані). Це може бути корисно для цілого ряду випадків, таких як вибір підмножини коваріатів для використання в прогностичній моделі; якщо дві змінні сильно корелюються, можливо, ви хочете використовувати лише одну з двох у вашій прогнозній моделі.


Дякую за пояснення. В останньому абзаці ви описуєте проблеми, які можуть виникнути, коли незалежні змінні дуже колінеарні. Здається, було б легше подивитися на коваріацію / кореляцію фактичного s, ніж β s. В г ( β ) = Е ( ε 2 ) ( Х ' х ) - 1 існує зворотна у формулі. Хβ
Vаr(β^)=Е(ε^2)(Х'Х)-1
mss

8

Існує два "види" коефіцієнтів регресії:

  1. "Справжні" коефіцієнти регресії (зазвичай позначаються ), які описують базовий процес генерування даних. Це фіксовані числа або "параметри". Прикладом може бути швидкість світла с , яка (ми припускаємо) завжди однакова скрізь у доступному Всесвіті.βc
  2. Розрахункові коефіцієнти регресії (зазвичай позначаються позначається або & beta ; ) , які обчислюються із зразків даних. Зразки - це сукупність випадкових змінних, тому оцінені коефіцієнти регресії також є випадковими змінними. Прикладом може бути оцінка для с, отримана в експерименті.бβ^c

Тепер подумайте, що означає коваріація. Візьмемо будь-які дві випадкові величини і Y . Якщо | C o v ( X , Y ) | є високим, тоді, коли ви малюєте велике абсолютне значення X, ви також можете розраховувати намалювати велике абсолютне значення Y в тому ж напрямку. Зауважимо, що "високий" тут відносно величини варіації X та Y , як зазначено в коментарях.ХY|Соv(Х,Y)|ХYХY

бб1б2б1б2б1б2

б1б1

Соv(б1,б2)

Щодо того, для чого це насправді використовується, відповідь Cliff AB - це хороший підсумок.


бiбjij

1
@whuber дякую, і я насправді написав "кореляцію" в один момент. Я
приберу

Оскільки я, можливо, деякий час не повертаюсь до цієї теми, +1 заздалегідь для редагування!
whuber

зробив таку ж помилку в моєму описі!
Кліф АВ

@whuber зараз я насправді вдруге здогадуюсь про власне розуміння коваріації. Це моє питання лише в тому, що я не наголошував на тому, що ваги можуть бути різними, чи я пропускаю щось інше? Я натрапив на ваші "скриньки" пояснення, і я не бачу, що це може бути
shadowtalker
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.