Я читаю книгу про лінійну регресію і маю деякі проблеми з розумінням дисперсійно-коваріаційної матриці :
Діагональні елементи досить прості, але поза діагоналі трохи складніше, що мене що
але тут немає і сліду та .
Я читаю книгу про лінійну регресію і маю деякі проблеми з розумінням дисперсійно-коваріаційної матриці :
Діагональні елементи досить прості, але поза діагоналі трохи складніше, що мене що
але тут немає і сліду та .
Відповіді:
Це насправді класне питання, яке ставить під сумнів ваше основне розуміння регресії.
Спочатку вийміть будь-яку початкову плутанину щодо позначень. Ми дивимось на регрес:
де і є істинних та , а - залишки регресії. Зауважимо, що реальна регресія, що лежить в основі, позначається як:U
З очікуванням і дисперсії . Деякі книги позначають як і ми адаптуємо цю умову тут. Ми також використовуємо матричне позначення, де b - 2х1 вектор, який містить оцінювачі , а саме . (Також для наочності я ставлюсь до Х як визначено в наступних розрахунках.)& beta ; & beta ; = [ & beta ; 0 , & beta ; 1 ] ' Ь = [ Ь 0 , Ь 1 ] '
Тепер до вашого питання. Ваша формула коваріації справді правильна, тобто:
Я думаю, ви хочете знати, як у цій формулі є справжні коефіцієнти ? Вони насправді скасовуються, якщо ми зробимо це на крок далі, розширивши формулу. Для цього зауважте, що дисперсія популяції оцінювача задається:
Ця матриця містить варіації діагональних елементів та коваріацій у позадіагональних елементах.
Щоб прийти до вищенаведеної формули, давайте узагальнимо вашу заяву, використовуючи матричну нотацію. Отже, позначимо дисперсію з а очікування - з .
По суті, ми маємо загальну формулу дисперсії, просто використовуючи матричне позначення. Рівняння розв’язується при заміні в стандартному виразі для оцінювача . Також припустимо, що є неупередженим оцінювачем. Отже, ми отримуємо:
Зауважимо, що у нас з правого боку - 2x2 матриця, а саме , але ви, можливо, вже вгадаєте, що буде з цим терміном незабаром.
Замінивши нашим виразом на справжній базовий процес генерування даних вище, ми маємо:
оскільки . Крім того, квадратичний термін скасовується як очікувалося.
Таким чином, ми маємо:
За лінійністю очікувань. Зауважимо, що за припущенням і оскільки є симетричною матрицею і, таким чином, є її транспозицією. Нарешті ми доходимо
Тепер, коли ми позбулися всіх термінів. Інтуїтивно, дисперсія оцінювача не залежить від значення справжнього базового коефіцієнта, оскільки це не є випадковою змінною. Результат справедливий для всіх окремих елементів в матриці коваріації дисперсії, як показано в книзі, таким чином, також дійсний і для вимкнених діагональних елементів, а також для для скасування відповідно. Єдина проблема полягала в тому, що ви застосували загальну формулу для дисперсії, яка спочатку не відображає це скасування.
Зрештою, дисперсія коефіцієнтів зводиться до і не залежить від . Але що це означає? (Я вважаю, ви також попросили більш загальне розуміння загальної матриці коваріації)
Подивіться на формулу в книзі. Він просто стверджує, що дисперсія обчислювача збільшується, коли справжній базовий помилка є більш галасливим ( збільшується), але зменшується, коли розширення X збільшується. Оскільки наявність спостережень, розподілених навколо справжнього значення, дозволяє вам, як правило, побудувати точніший і таким чином наближений до істинної . З іншого боку, умови коваріації на позадіагоналі стають практично актуальними при тестуванні гіпотез спільних гіпотез, таких як . За винятком того, що вони трохи підступні, насправді. Сподіваюсь, це пояснює всі питання. β b 0 = b 1 = 0
Здається, що - це прогнозовані значення (очікувані значення). Вони роблять перемикання між і . E ( b 0 ) = β 0 E ( b 1 ) = β 1