Очікуване значення , коефіцієнт визначення, під нульовою гіпотезою


12

Мені цікаво твердження, зроблене внизу першої сторінки цього тексту стосовно коригуванняRadjusted2

Radjusted2=1(1R2)(n1nm1).

У тексті зазначено:

Логіка коригування така: у звичайній множинній регресії випадковий предиктор пояснює в середньому частку 1/(n1) варіації відповіді, так що m випадкові предиктори пояснюють разом, в середньому, m/(n1) варіації відповіді; іншими словами, очікуване значення R2 дорівнює E(R2)=m/(n1) . Застосовуючи формулу [ Radjusted2 ] до цього значення, де всі передбачувачі є випадковими, дає Radjusted2=0 "

Здається, це дуже проста та інтерпретована мотивація для Radjusted2 . Однак мені не вдалося розробити, що E(R2)=1/(n1) для одного випадкового (тобто некорельованого) прогноктора.

Чи міг би хтось вказати мене в потрібному напрямку?


У випадку, якщо посилання в майбутньому відмирає, ви могли б надати повну інформацію? Дякую.
Річард Харді

Відповіді:


10

Це точна математична статистика. Дивіться цей пост для виведення розподілу під гіпотезою, що всі регресори (бар постійний термін) некорельовані із залежною змінною ("випадкові предиктори").R2

Цей розподіл є бета-версією, - кількість предикторів, не рахуючи постійний термін, і розмір вибірки,mn

R2Beta(m2,nm12)

і так

E(R2)=m/2(m/2)+[(nm1)/2]=mn1

Це, мабуть, є розумним способом "виправдати" логіку за скоригованим : якщо дійсно всі регресори є некорельованими, то скоригований "в середньому" дорівнює нулю.R2R2


2
Просто шматочок інформації, який мені знадобився! Дякую! І хай живе стек обмін!
gregory_britten

1
Мене цікавить випадок, коли не всі регресори мають некорельовану залежну змінну. Чи мали б ви якусь інформацію про це?
Олів'є

@Olivier Ні, я не боюся. Подивіться в розділі "F-тест на значення регресії, розподіл за альтернативою" або щось подібне.
Алекос Пападопулос
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.