Квантильна регресія: функція втрати


24

Я намагаюся зрозуміти кількісну регресію, але одне, що змушує мене страждати, - це вибір функції втрати.

ρτ(u)=u(τ1{u<0})

Я знаю, що мінімум очікування ρτ(yu) дорівнює τ% -квантилу, але яка інтуїтивна причина починати з цієї функції? Я не бачу зв'язку між мінімізацією цієї функції та кількісною. Може хтось мені це пояснить?

Відповіді:


28

Я розумію це питання як прохання зрозуміти, як можна було б створити будь-яку функцію втрат, яка виробляє даний квантил як мінімізатор втрат, незалежно від того, яким може бути базовий розподіл. Тоді було б незадовільно просто повторити аналіз у Вікіпедії чи деінде, що показує, що ця функція втрат працює.

Почнемо з чогось звичного і простого.

Те , що ви говорите це знайти «місце розташування» щодо розподілу або набору даних F . Наприклад, добре відомо, що середнє значення ˉ x мінімізує очікуваний залишковий квадрат; тобто це значення, для якогоxFx¯

LЖ(х¯)=R(х-х¯)2гЖ(х)

якомога менше. Я використав це позначення, щоб нагадати, що походить від втрати , що вона визначається F , але найголовніше, що це залежить від числа ˉ x .LЖх¯

Стандартний спосіб показати, що мінімізує будь-яку функцію, починається з демонстрації, що значення функції не зменшується, коли x незначно змінюється. Таке значення називається критичною точкою функції.хх

Яка функція втрати призведе до того, що перцентиль F - 1 ( α ) стане критичною точкою? Збиток для цієї вартості будеΛЖ-1(α)

LF(F1(α))=RΛ(xF1(α))dF(x)=01Λ(F1(u)F1(α))du.

Щоб це було критичним моментом, його похідна повинна дорівнювати нулю. Так як ми просто намагаємося знайти якийсь - то рішення, ми не зупинимося , щоб побачити чи маніпуляції законні: ми плануємо перевірити технічні деталі (наприклад, чи дійсно ми можемо диференціювати , і т.д. ) в кінці. Таким чиномΛ

(1)0=LF(x)=LF(F1(α))=01Λ(F1(u)F1(α))du=0αΛ(F1(u)F1(α))duα1Λ(F1(u)F1(α))du.

У лівій частині аргумент негативний, тоді як у правій - позитивний. Крім цього, ми мало контролюємо значення цих інтегралів, оскільки F може бути будь-якою функцією розподілу. Отже , наша єдина надія полягає в тому, щоб зробити Л ' залежить тільки від знака аргументу, а в іншому випадку вона повинна бути постійною.ΛFΛ

Це означає, що буде кусочно лінійним, потенційно з різними нахилами ліворуч та праворуч від нуля. Зрозуміло, що вона повинна зменшуватися, коли наближається до нуля - це врешті-решт втрата, а не вигода . Крім того, масштабування Λ постійною не змінить її властивостей, тому ми можемо сміливо встановити нахил лівої руки на - 1 . Нехай τ > 0 - нахил правої руки. Тоді ( 1 ) спрощується доΛΛ1τ>0(1)

0=ατ(1α),

звідси унікальне рішення - до позитивного кратного,

Λ(x)={x, x0α1αx, x0.

Помноживши це (природне) рішення на , щоб очистити знаменник, виробляється функція втрат, представлена ​​у запитанні.1α

Очевидно, що всі наші маніпуляції є математично законними, коли має таку форму. Λ


19

Те, як ця функція втрати виражається, є приємною та компактною, але я думаю, що її легше зрозуміти, переписавши її як

ρτ(Xm)=(Xm)(τ1(Xm<0))={τ|Xm|ifXm0(1τ)|Xm|ifXm<0)

Якщо ви хочете отримати інтуїтивне розуміння того, чому мінімізація цієї функції втрат дає τ й кількісний показник, корисно розглянути простий приклад. Нехай X - рівномірна випадкова величина між 0 і 1. Виберемо також конкретне значення для τ , скажімо, 0.25 .

m=0.25mτ


1
Чи не повинно бути інакше? Недогадка буде коштувати втричі дорожче?
Еді Біс

Дякуємо, що це зробили. Формула правильна, але спочатку я її неправильно сформулював у своєму поясненні.
джет
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.