Запитання з тегом «r-squared»

Коефіцієнт детермінації, як правило, символізується , є часткою загальної дисперсії відповіді, поясненої регресійною моделлю. Можна також використовувати для запропонованих псевдо R-квадратів, наприклад, для логістичної регресії (та інших моделей.) R2

3
Чому коригується R-квадрат менше, ніж R-квадрат, якщо відрегульований R-квадрат прогнозує модель краще?
Наскільки я розумію, пояснює, наскільки добре модель прогнозує спостереження. Налагоджений - це той, який враховує більше спостережень (або ступенів свободи). Отже, скоригований прогнозує модель краще? Тоді чому це менше ? Здається, часто повинно бути більше.R2R2R^2R2R2R^2R2R2R^2R2R2R^2

2
Як вибрати між різними регульованими
Я маю на увазі скориговані формули R-квадрата, запропоновані: Єзекіїль (1930), який, на мою думку, є таким, який зараз використовується в SPSS. R2adjusted=1−(N−1)(N−p−1)(1−R2)Radjusted2=1−(N−1)(N−p−1)(1−R2)R^2_{\rm adjusted} = 1 - \frac{(N-1)}{(N-p-1)} (1-R^2) Олкін і Пратт (1958) R2unbiased=1−(N−3)(1−R2)(N−p−1)−2(N−3)(1−R2)2(N−p−1)(N−p+1)Runbiased2=1−(N−3)(1−R2)(N−p−1)−2(N−3)(1−R2)2(N−p−1)(N−p+1)R^2_{\rm unbiased} = 1 - \frac{(N-3)(1-R^2)}{(N-p-1)} - \frac{2(N-3)(1-R^2)^2}{(N-p-1)(N-p+1)} За яких обставин (якщо такі є) я повинен віддати перевагу …

1
Як отримати R-квадрат для лесового пристосування?
Як обчислити статистику R-квадрата ( ) в R для та / або виводу функції? Наприклад, для цих даних:r2r2r^2loesspredict cars.lo <- loess(dist ~ speed, cars) cars.lp <- predict(cars.lo, data.frame(speed = seq(5, 30, 1)), se = TRUE) cars.lpмає два масиви fitдля моделі та se.fitдля стандартної помилки.
15 r  r-squared  loess 

2
Різниця між вибором функцій на основі "F регресії" та на основі значень
Чи порівнюють функції, використовуючи F-regressionте саме, що співвідносити функції з міткою окремо і дотримуватися значення ?R2R2R^2 Я часто бачив, як мої колеги використовують F regressionдля вибору функцій у своєму трубопроводі машинного навчання sklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` Деякі, будь ласка, скажіть мені - чому це дає ті ж результати, що і лише співвідносивши …


4
Чому ? (Одна змінна лінійна регресія)
Примітка: SSTSSTSST = сума квадратів Всього, = сума помилок у квадраті , і = сума регресії квадратів. Рівняння в заголовку часто записується як:SSESSESSESSRSSRSSR ∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2\sum_{i=1}^n (y_i-\bar y)^2=\sum_{i=1}^n (y_i-\hat y_i)^2+\sum_{i=1}^n (\hat y_i-\bar y)^2 Досить просте запитання, але я шукаю інтуїтивне пояснення. Інтуїтивно мені здається, що мав би більше сенсу. Наприклад, припустімо, що …

2
Чи поступова регресія забезпечує упереджену оцінку r-квадрата населення?
У психології та інших сферах часто застосовується форма ступінчастої регресії, яка передбачає наступне: Подивіться на провідники, що залишилися (спочатку їх у моделі немає) та визначте предиктор, що призводить до найбільшої зміни r-квадрата; Якщо p-значення зміни r-квадрата менше альфа (зазвичай .05), тоді включіть цей предиктор і поверніться до кроку 1, інакше …

1
Яка об'єктивна оцінка R-квадрата населення?
Мені цікаво отримати об'єктивну оцінку R2R2R^2 при множинній лінійній регресії. Розмірковуючи, я можу придумати два різних значення, що є неупередженою оцінкою R2R2R^2 може бути яка намагається відповідати. З вибірки R2R2R^2 : r-квадрат, який був би отриманий, якщо рівняння регресії отримано з вибірки (тобто,β^β^\hat{\beta} ), застосовувалося до нескінченного обсягу даних, що …


1
R-квадрат у лінійній моделі віршів відхилення в узагальненій лінійній моделі?
Ось мій контекст щодо цього питання: З того, що я можу сказати, ми не можемо виконати звичайну регресію найменших квадратів у R при використанні зважених даних та surveyпакету. Тут ми маємо використовувати svyglm(), яка замість цього виконує узагальнену лінійну модель (яка може бути одне і те саме? Я тут нечіткий …

2
Вибір компонентів PCA, які розділяють групи
Я часто використовував для діагностування своїх багатоваріантних даних за допомогою PCA (дані omics із сотнями тисяч змінних і десятки чи сотні зразків). Дані часто походять від експериментів з декількома категоричними незалежними змінними, що визначають деякі групи, і мені часто доводиться пройти кілька компонентів, перш ніж я зможу знайти ті, які …

2
Як я можу використовувати значення для перевірки припущення про лінійність у аналізі множинної регресії?
Наведені нижче графіки - це залишкові діаграми розсіювання регресійного тесту, для яких припущення про «нормальність», «гомоскедастичність» та «незалежність» вже точно виконані! Для тестування припущення "лінійності" , хоча, переглядаючи графіки, можна здогадатися, що співвідношення криволінійне, але питання полягає в тому, як можна використати значення для "R2 лінійного" для перевірки припущення про …

2
Формула для 95% довірчого інтервалу для
Я гуглив і шукав stats.stackexchange, але не можу знайти формулу для обчислення 95% довірчого інтервалу для значення для лінійної регресії. Хтось може це надати?R2R2R^2 Ще краще, скажімо, я провів лінійну регресію нижче в R. Як би я обчислив 95% довірчий інтервал для значення за допомогою коду R.R2R2R^2 lm_mtcars <- lm(mpg …

2
Обчислення у змішаних моделях з використанням методу R2glmm Nakagawa & Schielzeth (2013)
Я читав про обчислення значень R2R2R^2 у змішаних моделях і після прочитання відповідей на R-sig, інших публікацій на цьому форумі (я б зв’язав декілька, але мені не вистачає репутації) та кілька інших посилань, я розумію, що використовуючи Значення R2R2R^2 у контексті змішаних моделей є складним. Однак я нещодавно натрапив на …

1
Чому квадрати дає пояснену дисперсію?
Це може бути основним питанням, але мені було цікаво, чому значення в регресійній моделі може бути просто в квадрат, щоб дати фігуру поясненої дисперсії?RRR Я розумію, що коефіцієнт може дати силу відносинам, але я не розумію, як просто квадратування цього значення дає міру поясненої дисперсії.RRR Будь-яке просте пояснення цьому? Дуже …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.