R-квадрат у квантильній регресії


21

Я використовую квантильну регресію, щоб знайти прогнози 90-х відсотків моїх даних. Я роблю це в R, використовуючи quantregпакет. Як я можу визначити для квантильної регресії, яка вказуватиме на скільки змінності пояснюються прогнозні величини?r2

Що я дійсно хочу знати: "Будь-який метод, який я можу використовувати, щоб знайти, скільки змінності пояснюється?". Рівні значущості за значеннями P доступні в виході команди: summary(rq(formula,tau,data)). Як я можу отримати корисність?


7
R2 не має відношення до кількісної регресії.
whuber

@whuber: Будь-який альтернативний метод, який я можу використати, щоб знайти, скільки змінності пояснюється?
rnso

2
Це було б добре задати в своєму питанні питання, а не закопувати в коментарі! "Змінювана пояснюваність" (так чи інакше вимірюється в залежності від дисперсій) - це концепція найменших квадратів; можливо, те, що ви хочете, є відповідним показником статистичної значущості або, можливо, корисності придатності.
whuber

Для будь-якої цифри заслуги потрібно враховувати, що було б хорошим результатом, що було б поганим результатом і що було б неважливо. Наприклад, це не критика 90-го перцентилету, якщо це хитрий прогноз 10-го перцентилету. Вашим орієнтиром може бути те, що ви могли б використовувати, якби не використовували кількісну регресію. Якщо ваші прогнози безперервні, це може бути важко визначити.
Нік Кокс

1
@whuber: Я додав, що в тілі питання. Рівень значущості за значенням P доступний у підсумковому (rq (формула, tau, дані)) виведенні. Як я можу отримати корисність?
rnso

Відповіді:


23

Коенкер і Мачадо описують R 1[1]R1 , локальну міру корисності придатності до конкретного ( ) квантиля.τ

V(τ)=minbρτ(yixib)

Нехай і - оцінки коефіцієнтів для повної моделі та обмежена модель, і нехай і буде відповідні терміни. ~ β (τ) V ~ V Vβ^(τ)β~(τ)V^V~V

Вони визначають корисність критерію придатності .R1(τ)=1V^V~

Koenker надає код для тут ,V

rho <- function(u,tau=.5)u*(tau - (u < 0))
V <- sum(rho(f$resid, f$tau))

Отже, якщо ми обчислимо для моделі лише з перехопленням ( - або в фрагменті коду нижче), а потім з необмеженою моделлю ( ), ми можемо обчислити це - принаймні умовно - дещо схожий на звичайний .~ V V R 2VV~V0V^R1 <- 1-Vhat/V0R2

Редагувати: У вашому випадку, звичайно, другий аргумент, який буде розміщено там, де f$tauє виклик у другому рядку коду, буде залежно від значення, яке tauви використовували. Значення в першому рядку просто встановлює значення за замовчуванням.

"Пояснення розбіжності щодо середньої величини" насправді не те, що ви робите з кількісною регресією, тому не варто сподіватися на дійсно еквівалентну міру.

Я не думаю, що концепція добре перекладається на кількісну регресію. Ви можете визначити різні більш-менш аналогічні величини, як тут, але незалежно від того, що ви вибрали, ви не матимете більшості властивостей, які має реальна в регресії OLS. Потрібно чітко визначити, які саме властивості вам потрібні, а які - ні, у деяких випадках можливо встановити міру, яка робить те, що ви хочете.R 2R2R2

-

[1] Koenker, R and Machado, J (1999),
Добрість придатності та пов'язані з ними процеси висновків для квантильної регресії,
Журнал Американської статистичної асоціації, 94 : 448, 1296-1310


Чи повинен tau = 0,9 бути не 0,5?
Мастеров Димитрій Вікторович

Так, так, але якщо ви подаєте правильний другий аргумент (як це робиться у другому рядку, який я цитував вище), так це працює. Значення 0,5 в першому рядку - це просто аргумент за замовчуванням, якщо ви не вказуєте, tauколи ви викликаєте функцію. Я уточню в дописі.
Glen_b -Встановіть Моніку

@Glen_b Дякую за пояснення. Якщо я не роблю щось дурне, V представляється сумою зважених відхилень щодо розрахункового квантиля, а не псевдо- . R2
Мастеров Дмитро Васильович

@Dimitriy Uh, ти маєш рацію, я щось залишив. Невдовзі я це виправлю.
Glen_b -Встановіть Моніку

@Dimitriy Я думаю, що зараз це виправили.
Glen_b -Встановіть Моніку

19

Міра псевдо- запропонована Коенкером та Мачадо (1999) в JASA, вимірює корисність, порівнюючи суму зважених відхилень для моделі інтересу з тією самою сумою від моделі, в якій відображається лише перехоплення. Він розраховується якR2

R1(τ)=1yiy^iτ|yiy^i|+yi<y^i(1τ)|yiy^i|yiy¯τ|yiy¯|+yi<y¯i(1τ)|yiy¯|,

де - пристосований й квантил для спостереження , а - пристосоване значення від перехоплення лише модель.тя ˉ у =& betaтy^i=ατ+βτxτiy¯=βτ

[ 0 , 1 ] τ R 2R1(τ) повинен лежати в , де 1 відповідатиме ідеальному придатності, оскільки чисельник, який складається із зваженої суми відхилень, дорівнюватиме нулю. Це локальна міра придатності для QRM, оскільки вона залежить від , на відміну від глобального від OLS. Це, мабуть, джерело попереджень про його використання: якщо модель укладається в хвіст, немає гарантії, що вона добре вписується в іншому місці. Цей підхід також може бути використаний для порівняння вкладених моделей.[0,1]τR2

Ось приклад в R:

library(quantreg)
data(engel)

fit0 <- rq(foodexp~1,tau=0.9,data=engel)
fit1 <- rq(foodexp~income,tau=0.9,data=engel)

rho <- function(u,tau=.5)u*(tau - (u < 0))
R1 <- 1 - fit1$rho/fit0$rho

Можливо, це можна зробити більш елегантно.


Ваша формула не відображається добре. Після знаку мінус: R_1(\tau) = 1 - 􀀀останній символ - це якийсь безлад. Ви можете це перевірити? Можливо, ви вставили якийсь нестандартний символ замість того, щоб використовувати Текс.
Тім

@Tim Я нічого дивного не бачу ні в тексті, ні на екрані.
Мастеров Дмитро Васильович

Це схоже на Linux та Windows: snag.gy/ZAp5T.jpg
Tim

@Tim Це поле нічого не відповідає, тому його можна ігнорувати. Я спробую її відредагувати пізніше з іншої машини.
Мастеров Дмитро Васильович
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.