Розглянемо просту лінійну модель:
уy = X ′ ββ + ϵ
де і
, і містить стовпець констант.ϵ i ∼ i . i . д .N ( 0 , σ 2 )
Моє запитання, з огляду на , \ beta та \ sigma , чи існує формула для нетривіальної верхньої межі на \ mathrm {E} (R ^ 2) *? (якщо припустити, що модель була оцінена OLS).E ( X ′ X )
* Я припускав, пишучи це, що отримати E ( R 2 )
EDIT1
використовуючи розчин, отриманий Стефаном Лоран (див. нижче), ми можемо отримати нетривіальну верхню межу на E ( R 2 )
Стефан Лоран отримав наступне: R 2 ∼ B ( p - 1 , n - p , λ )
λ = | | X ′ β - E ( X ) ′ β 1 n | | 2σ 2
Так
E ( R 2 ) = E ( χ 2 p - 1 ( λ )χ 2 p - 1 ( λ ) + χ 2 n - p )≥E(χ 2 p - 1 (λ))E ( χ 2 p - 1 ( λ ) ) + E ( χ 2 n - p )
де χ 2 k ( λ )
λ + p - 1λ + n - 1
це дуже щільно (набагато жорсткіше, ніж я очікував, що це можливо):
наприклад, використовуючи:
rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)
середнє значення понад 1000 моделювання становить . Теоретична верхня межа, наведена вище, дає . Здається, пов'язана однаково точна для багатьох значень . Воістину приголомшливо!R 2 0.960819
0.9609081
R 2
EDIT2:
після подальших досліджень виявляється, що якість наближення верхньої межі до покращиться, коли зростає (а все інше дорівнює збільшується з ).E ( R 2 ) λ + p λ n