Я розумію це питання як прохання зрозуміти, як можна було б створити будь-яку функцію втрат, яка виробляє даний квантил як мінімізатор втрат, незалежно від того, яким може бути базовий розподіл. Тоді було б незадовільно просто повторити аналіз у Вікіпедії чи деінде, що показує, що ця функція втрат працює.
Почнемо з чогось звичного і простого.
Те , що ви говорите це знайти «місце розташування» щодо розподілу або набору даних F . Наприклад, добре відомо, що середнє значення ˉ x мінімізує очікуваний залишковий квадрат; тобто це значення, для якогоx∗Жx¯
LF(x¯) =∫R( х -x¯)2dF( х )
якомога менше. Я використав це позначення, щоб нагадати, що походить від втрати , що вона визначається F , але найголовніше, що це залежить від числа ˉ x .LЖх¯
Стандартний спосіб показати, що мінімізує будь-яку функцію, починається з демонстрації, що значення функції не зменшується, коли x ∗ незначно змінюється. Таке значення називається критичною точкою функції.х∗х∗
Яка функція втрати призведе до того, що перцентиль F - 1 ( α ) стане критичною точкою? Збиток для цієї вартості будеΛЖ- 1( α )
LF(F−1(α))=∫RΛ(x−F−1(α))dF(x)=∫10Λ(F−1(u)−F−1(α))du.
Щоб це було критичним моментом, його похідна повинна дорівнювати нулю. Так як ми просто намагаємося знайти якийсь - то рішення, ми не зупинимося , щоб побачити чи маніпуляції законні: ми плануємо перевірити технічні деталі (наприклад, чи дійсно ми можемо диференціювати , і т.д. ) в кінці. Таким чиномΛ
0=L′F(x∗)=L′F(F−1(α))=−∫10Λ′(F−1(u)−F−1(α))du=−∫α0Λ′(F−1(u)−F−1(α))du−∫1αΛ′(F−1(u)−F−1(α))du.(1)
У лівій частині аргумент негативний, тоді як у правій - позитивний. Крім цього, ми мало контролюємо значення цих інтегралів, оскільки F може бути будь-якою функцією розподілу. Отже , наша єдина надія полягає в тому, щоб зробити Л ' залежить тільки від знака аргументу, а в іншому випадку вона повинна бути постійною.ΛFΛ′
Це означає, що буде кусочно лінійним, потенційно з різними нахилами ліворуч та праворуч від нуля. Зрозуміло, що вона повинна зменшуватися, коли наближається до нуля - це врешті-решт втрата, а не вигода . Крім того, масштабування Λ постійною не змінить її властивостей, тому ми можемо сміливо встановити нахил лівої руки на - 1 . Нехай τ > 0 - нахил правої руки. Тоді ( 1 ) спрощується доΛΛ−1τ>0(1)
0=α−τ(1−α),
звідси унікальне рішення - до позитивного кратного,
Λ(x)={−x, x≤0α1−αx, x≥0.
Помноживши це (природне) рішення на , щоб очистити знаменник, виробляється функція втрат, представлена у запитанні.1−α
Очевидно, що всі наші маніпуляції є математично законними, коли має таку форму. Λ