Основна ідея кількісної регресії випливає з того, що аналітик зацікавлений у розподілі даних, а не просто середніх даних. Почнемо із середнього.
Середня регресія відповідає лінії виду середньому значенню даних. Іншими словами, E ( Y | X = x ) = x β . Загальний підхід для оцінки цієї лінії використовує метод найменшого квадрату, arg min β ( y - x β ) ′ ( y - X β ) .y=XβE(Y|X=x)=xβargminβ(y−xβ)′(y−Xβ)
З іншого боку, середня регресія шукає лінію, яка очікує, що половина даних знаходиться на сторонах. У цьому випадку цільовою функцією є де | . | є першою нормою.argminβ|y−Xβ||.|
Розширення ідеї про медіану до квантилію призводить до квантильної регресії. Ідея полягає в тому, щоб знайти лінію, що відсоток даних виходить за межі цього.α
Тут ви зробили невелику помилку, Q-регресія - це не так, як знайти квантил даних, а потім підібрати рядок до цього підмножини (або навіть межі, яка є більш складною).
α
β^α=argminβ{α|y−Xβ|I(y>Xβ)+(1−α)|y−Xβ|I(y<Xβ)}.
Як бачите, ця розумна цільова функція - це не що інше, як переклад квантиля на проблему оптимізації.
βα