Як отримати інтервал довіри щодо зміни r-квадрата населення


10

Для простого прикладу припустимо, що існує дві моделі лінійної регресії

  • Модель 1 має три провісники, x1a, x2b, іx2c
  • Модель 2 має три предиктори з моделі 1 та два додаткові прогнози x2aтаx2b

Існує рівняння регресії чисельності населення, де пояснюється дисперсія популяції для Моделі 1 та для Моделі 2. Інкрементальна дисперсія, пояснена Модель 2 у сукупності, є ρ 2 ( 2 ) Δ ρ 2 = ρ 2 ( 2 ) - ρ 2 ( 1 )ρ(1)2ρ(2)2Δρ2=ρ(2)2-ρ(1)2

Мені цікаво отримати стандартні помилки та довірчі інтервали для оцінювача . Хоча приклад стосується 3 та 2 предикторів відповідно, мій науковий інтерес стосується широкого кола різної кількості предикторів (наприклад, 5 і 30). Перша моя думка полягала в тому, щоб використовувати в якості оцінювача і завантажувати його, але я не був впевнений, чи буде це бути відповідним. Δ r 2 a d j = r 2 a d j ( 2 ) - r 2 a d j ( 1 )Δρ2Δrагj2=rагj(2)2-rагj(1)2

Запитання

  • Чи розумний оцінювач ? Δ ρ 2Δrагj2Δρ2
  • Як можна отримати довірчий інтервал для зміни r-квадрата сукупності (тобто )?Δρ2
  • Чи підходить для завантаження підрахунок довірчого інтервалу?Δρ2

Будь-які посилання на симуляції чи опубліковану літературу також були б вітати.

Приклад коду

Якщо це допомагає, я створив невеликий набір даних моделювання в R, який можна використовувати для демонстрації відповіді:

n <- 100
x <- data.frame(matrix(rnorm(n *5), ncol=5))
names(x) <- c('x1a', 'x1b', 'x1c', 'x2a', 'x2b')
beta <- c(1,2,3,1,2)
model2_rho_square <- .7
error_rho_square <- 1 - model2_rho_square
error_sd <- sqrt(error_rho_square / model2_rho_square* sum(beta^2))
model1_rho_square <- sum(beta[1:3]^2) / (sum(beta^2) + error_sd^2)
delta_rho_square <- model2_rho_square - model1_rho_square

x$y <- rnorm(n, beta[1] * x$x1a + beta[2] * x$x1b + beta[3] * x$x1c +
               beta[4] * x$x2a + beta[5] * x$x2b, error_sd)

c(delta_rho_square, model1_rho_square, model2_rho_square)
summary(lm(y~., data=x))$adj.r.square - 
        summary(lm(y~x1a + x1b + x1c, data=x))$adj.r.square

Причина для занепокоєння при завантаженні

Я запустив завантажувальний механізм за деякими даними з приблизно 300 випадків, 5 провісників у простій моделі та 30 прогнозів у повній моделі. У той час як оцінка вибірки з використанням відрегульованої різниці r-квадратів 0.116, інтервал завантаженого довіри був переважно більшим CI95% (0,095 до 0,214), а середнє значення завантажувальних рядів ніде не було поряд із оцінкою вибірки. Швидше за все, середнє значення вибіркових зразків було орієнтоване на оцінку вибірки різниці між r-квадратами у вибірці. Це незважаючи на те, що я використовував зразок, скоригований r-квадратами, щоб оцінити різницю.

Цікаво, що я спробував альтернативний спосіб обчислення asΔρ2

  1. обчислити зразок r-квадратної зміни
  2. відрегулювати зміну зразка r-квадрата за допомогою стандартної відрегульованої формули r-квадрата

При застосуванні до вибіркових даних це зменшило оцінку до, але довірчі інтервали видалися підходящими для способу, про який я згадав спочатку, CI95% (.062, .179) із середнім значенням .118.Δρ2.082

Загалом, я стурбований тим, що завантаження даних передбачає, що вибірки є сукупністю, і тому підрахунки, що зменшення кількості надмірних розмірів може не працювати належним чином.


"Однак я стурбований тим, що завантажувати таке значення, скориговане для населення, може бути проблематично". - чому?
січня

@January Я відредагував це питання і спробував сформулювати свою стурбованість щодо завантажувальної програми з коригуваним r-квадратам.
Джеромі Англім

Яке населення має R квадрат ? Я переглянув дане тут визначення, але для мене не має сенсу, оскільки не однаково розподілені. y iσу2уi
Стефан Лоран

@ StéphaneLaurent - це відсоток дисперсії, пояснений у популяції рівнянням регресії населення. Або ви можете визначити це асимптотично як пропорцію дисперсії, пояснену у вашій вибірці, коли розмір вибірки наближається до нескінченності. Дивіться також цю відповідь щодо неупереджених оцінок населення r-квадрат . Це особливо актуально в психології, де нас часто більше цікавить справжні стосунки, а не насправді застосовуємо оцінене рівняння прогнозування.
Джеромі Англім

3
F-тест можна розглядати як тест гіпотези . Чи можна це використовувати для отримання стандартного інтервалу помилок та довіри, який ви шукаєте? Δρ2=0
Maarten Buis

Відповіді:


3

НаселенняR2

Я в першу чергу намагаюся зрозуміти визначення сукупності R-квадрата .

Цитуючи свій коментар:

Або ви можете визначити це асимптотично як пропорцію дисперсії, пояснену у вашій вибірці, коли розмір вибірки наближається до нескінченності.

Я думаю, ви маєте на увазі, що це межа вибірки коли модель повторюється нескінченно багато разів (з однаковими прогнозами на кожну копію). R2

Отже, яка формула асимптотичного значення вибірки ? Запишіть свою лінійну модель як у https://stats.stackexchange.com/a/58133/8402 , і використовуйте ті самі позначення, що й це посилання. Тоді можна перевірити, що зразок переходить до коли повторює модель нескінченно багато разів.R² R2 p o p R 2 : = λY=μ+σG
R2 Y=μ+σGpopR2:=λn+λY=μ+σG

Наприклад:

> ## design of the simple regression model lm(y~x0)
> n0 <- 10
> sigma <- 1
> x0 <- rnorm(n0, 1:n0, sigma)
> a <- 1; b <- 2 # intercept and slope
> params <- c(a,b)
> X <- model.matrix(~x0)
> Mu <- (X%*%params)[,1]
> 
> ## replicate this experiment k times 
> k <- 200
> y <- rep(Mu,k) + rnorm(k*n0)
> # the R-squared is:
> summary(lm(y~rep(x0,k)))$r.squared 
[1] 0.971057
> 
> # theoretical asymptotic R-squared:
> lambda0 <- crossprod(Mu-mean(Mu))/sigma^2
> lambda0/(lambda0+n0)
          [,1]
[1,] 0.9722689
> 
> # other approximation of the asymptotic R-squared for simple linear regression:
> 1-sigma^2/var(y)
[1] 0.9721834

Населення підмоделіR2

Тепер припустимо, що модель є з та розглянемо підмодель . H1:μW1H0:μW0Y=μ+σGH1:μW1H0:μW0

Тоді я вище сказав, що популяція моделі є де і а тоді в простому є .H 1 p o p R 2 1 : = λ 1R2H1popR12:=λ1n+λ1λ1=PZ1μ2σ2Z1=[1]W1ПZ1мк2=(мкi-мк¯)2

Тепер ви визначити населення з подмодели як асимптотическое значення , розрахованих за моделлю але при узагальненому припущенні моделі ? Асимптотичне значення (якщо воно є) здається важче знайти.R2 Н0R2Н0Н1


Спасибі Стефане. Мені доведеться подумати над тим, що ви говорите. Що стосується вашого питання. Я припускаю, що справжній процес генерації даних не відомий, але він однаковий для обох моделей, але існує справжня частка дисперсії, що пояснюється лінійною регресією в моделі 1 та моделі 2.
Джеромі Англім

@JeromyAnglim Формула (A3) цієї статті є окремим випадком моєї формули для однобічної моделі ANOVA. Отже, моя формула має бути загальним визначенням населення , але це не те, що ви використовуєте у своєму ОП. R2
Стефан Лоран

1
@JeromyAnglim Вивчення цього документу, здається, близьке до того, що ви шукаєте (із випадковими прогнозами).
Стефан Лоран

Дякую. Папір Algina, Keselman та Penfield виглядає дуже корисною. Я додав кілька коментарів до своєї відповіді про це.
Джеромі Англім

@JeromyAnglim Отже, яке припущення щодо прогнозів? Вони породжуються відповідно до багатовимірного гауссового розподілу?
Стефан Лоран

1

Замість того, щоб відповісти на запитання, яке ви задали, я буду запитати, чому ви ставите це питання. Я припускаю, що ви хочете знати, чи є

mod.small <- lm(y ~ x1a + x1b + x1c, data=x)

принаймні так добре, як

mod.large <- lm(y ~ ., data=x)

при поясненні y. Оскільки ці моделі вкладені, очевидним способом відповіді на це питання, здавалося б, є проведення аналізу дисперсії, порівнюючи їх, таким же чином, як ви могли б виконати аналіз відхилення для двох ГЛМ, наприклад

anova(mod.small, mod.large)

Тоді ви можете використовувати зразкове поліпшення R-квадрата між моделями як найкращу здогадку про те, яке би було покращення придатності у популяції, завжди припускаючи, що ви можете зрозуміти, чисельність R-квадрата населення. Особисто я не впевнений, що можу, але з цим це не має жодного значення.

Загалом, якщо ви зацікавлені в кількості населення, ви, мабуть, зацікавлені в узагальненні, тому міра відповідності вибірки не зовсім те, що ви хочете, однак "виправлено". Наприклад, перехресне підтвердження деякої кількості, яка оцінює сорт та кількість фактичних помилок, які ви могли б очікувати з вибірки, як, наприклад, MSE, могло б отримати те, що ви хочете.

Але цілком можливо, я тут щось пропускаю ...


Я високо ціную вашу відповідь, і це може бути корисною порадою для інших. Але мій контекст дослідження означає, що я законно зацікавлений у площі дельта-ро. У той час як більшість статистиків часто більше переймаються прогностичною корисністю моделі (наприклад, перекреслений дельта r-квадрат), я є вченим-психологом і особливо зацікавлений у власності населення. Крім того, мене не цікавить статистичне значення покращення. Мене цікавить розмір поліпшення. І я вважаю, що дельта-r-квадрат є корисною метрикою для індексації цього розміру вдосконалення.
Джеромі Англім

Що стосується MSE, то різні дослідження з психології використовують заходи за дуже різними показниками. Таким чином, існує потяг, правильний чи неправильний, до стандартизованих заходів, таких як r-квадрат.
Джеромі Англім

Досить справедливо, особливо щодо MSE. Я залишаюсь трохи збентеженим інтересом до завантаження та виводу населення, але відсутність інтересу до тестування, оскільки, мабуть, наївно, це здається рівнозначним питанням по-різному. Мені також важко чітко розрізнити вибіркове прогнозування від виводу для населення, але це, мабуть, перед кавою байєсіанство (коли прогнозування - це ще одна проблема виводу населення), стає на шляху.
кон'югатприор

Можливо, я трохи швидко заговорив. У моєму контексті дослідження часто є багато доказів того, що квадрат дельта-ро-більший за нуль. Питання, що цікавить, полягає у тому, яка ступінь збільшення. Тобто це тривіальне збільшення або теоретично осмислене збільшення. Таким чином, впевненість або достовірні інтервали дають мені оцінку невизначеності навколо цього збільшення. Я ще не примирив те, що я роблю тут, зі своїм розумінням байєсівської статистики, але я хотів би цього зробити.
Джеромі Англім

1

Далі представлено кілька можливостей для обчислення довірчих інтервалів на .ρ2

Подвійне коригування r-квадратного завантажувача

Моя поточна найкраща здогадка на відповідь - це зробити подвійний завантажений r-квадратний завантажувач. Я впровадив техніку. Він передбачає наступне:

  • Створіть набір зразків завантажувальної програми з поточних даних.
  • Для кожного завантаженого зразка:
    • обчисліть спочатку скоригований r-квадрат для двох моделей
    • обчислити другий скоригований r-квадрат на скоригованому значенні r-квадрата з попереднього кроку
    • Δρ2

Обґрунтування полягає в тому, що перший скоригований r-квадрат усуває зміщення, введене за допомогою завантаження (тобто завантаження передбачає, що вибірковий r-квадрат є сукупністю r-квадрат). Другий скоригований r-квадрат виконує стандартну корекцію, яка застосовується до нормальної вибірки для оцінки популяції r-квадрата.

На даний момент я бачу лише те, що застосування цього алгоритму генерує оцінки, які здаються правильними (тобто середнє значення theta_hat у завантажувальній програмі дуже близьке до вибірки theta_hat). Стандартна помилка відповідає моїй інтуїції. Я ще не перевіряв, чи забезпечує це належне частое покриття там, де відомий процес генерації даних, і я також не зовсім впевнений, як аргумент може бути виправданий з перших принципів

Якщо хтось бачить якісь причини, чому такий підхід був би проблематичним, я буду вдячний почути його.

Моделювання Альгіна та ін

Δρ2

Смітсон (2001) про використання параметра нецентральності

R2f2R2

Список літератури

  • Альгіна, Дж., Кесельман, Х'ю і Пенфілд, інтервали довіри RD для коефіцієнта кореляції множинних напівчасткових кореляцій. PDF
  • Смітсон, М. (2001). Правильні інтервали довіри для різних розмірів та параметрів регресійного значення: Важливість нецентральних розподілів у обчислювальних інтервалах. Навчально-психологічний вимір, 61 (4), 605-632.

1
Здається, ніхто тут (включаючи вас) не знає визначення вашого населення R-квадратом. Отже, ІМХО - це серйозно проблематичний підхід.
Стефан Лоран

@ StéphaneLaurent Дякую за це. Я визнаю, що до цього моменту я не розглядав r-квадрат населення як властивість суперечки. Наприклад, я міг запропонувати процес генерації даних, і був би r-квадрат, який підходить, коли мій розмір вибіркового моделювання наближається до нескінченності. І так само я припускаю, що для моїх даних існує процес генерації даних, і тому, якби можна було отримати нескінченний зразок, я міг би обчислити справжній r-квадрат сукупності.
Джеромі Англім

Так, але я маю враження, що ви також припускаєте, що процес прогнозування генерується. Я не можу зрозуміти, як це може мати сенс для загальної лінійної моделі.
Стефан Лоран
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.