Формула для 95% довірчого інтервалу для


13

Я гуглив і шукав stats.stackexchange, але не можу знайти формулу для обчислення 95% довірчого інтервалу для значення для лінійної регресії. Хтось може це надати?R2

Ще краще, скажімо, я провів лінійну регресію нижче в R. Як би я обчислив 95% довірчий інтервал для значення за допомогою коду R.R2

lm_mtcars <- lm(mpg ~ wt, mtcars)

1
Добре вам відомо, що співвідношення між кореляцією і полягає в тому, що ви співставляєте коефіцієнт кореляції, щоб отримати то чому б не обчислити довірчий інтервал для а потім квадратну нижню і верхню межі інтервалу? rR2R2r

1
@ ZERO: це буде працювати в простому лінійному регресії, тобто з одним провідником і перехопленням. Він не працюватиме для множинної лінійної регресії з більш ніж одним предиктором.
Стефан Коласа

@StephanKolassa, дуже правда! Я здогадуюсь, що я базував це на своєму Rкоді, де є лише один регресор, але це дуже вдалий момент для уточнення.


Наприклад, ви можете використовувати дуже невелику функцію R github.com/mayer79/R-confidence-intervals-R-squared на основі властивостей нецентрального F-розподілу.
Майкл М

Відповіді:


16

Ви завжди можете завантажувати його:

> library(boot)
> foo <- boot(mtcars,function(data,indices)
        summary(lm(mpg~wt,data[indices,]))$r.squared,R=10000)

> foo$t0
[1] 0.7528328

> quantile(foo$t,c(0.025,0.975))
     2.5%     97.5% 
0.6303133 0.8584067

R2


1
н=32к=1(0,546,0,960)2

Можливо, варто також відзначити, що ви можете отримати інші типи довірчого інтервалу (наприклад, BCa) з дистрибуції перестановки завантажувальної програми, використовуючи boot.ci().
Джеффрі

7

У R ви можете скористатися CI.Rsq()функцією, передбаченою психометричним пакетом. Щодо формули, яку вона застосовує, див. Cohen et al. (2003) , Прикладний множинний регресійний / кореляційний аналіз для поведінкових наук , с. 88:

SЕR2=4R2(1-R2)2(н-к-1)2(н2-1)(н+3)

R2±2SЕR2


3
(1-R2)R2R2н-к-1>60к+1підраховує перехоплення плюс кількість незалежних змінних.) Було б корисно побачити відпрацьований приклад, підтримуваний симуляцією, оскільки цей інтервал виглядає занадто широким.
whuber

На думку Вішарта (1931), формула непридатна для ненормальних розподілів.
abukaj
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.