Мені цікаво отримати об'єктивну оцінку при множинній лінійній регресії.
Розмірковуючи, я можу придумати два різних значення, що є неупередженою оцінкою може бути яка намагається відповідати.
- З вибірки : r-квадрат, який був би отриманий, якщо рівняння регресії отримано з вибірки (тобто, ), застосовувалося до нескінченного обсягу даних, що знаходяться поза вибіркою, але з тих самих даних, що генерують процес.
- Населення : r-квадрат, який був би отриманий, якби був отриманий нескінченний зразок і модель, пристосована до цього нескінченного зразка (тобто ), або ж просто R-квадрат, що має на увазі відомий процес генерації даних.
Я розумію, що скоригований R 2 R 2 R 2 R 2 призначений для компенсації надлишкового спостереження у зразку . Тим не менш, не ясно, чи скоригований насправді є неупередженою оцінкою , і якщо це неупереджена оцінка, яке з наведених вище визначень воно спрямоване оцінити.
Таким чином, мої запитання:
- Яка неупереджена оцінка того, що я називаю вище, зразком ?
- Яка об'єктивна оцінка того, що я називаю вище населення ?
- Чи є посилання, які надають моделювання чи інші докази неупередженості?