Співвідношення розподілу Лапласа до медіани (або норми L1) виявив сам Лаплас, який встановив, що використовуючи таку попередню оцінку медіани, а не середньої, як для нормального розподілу (див. Stingler, 1986 або Wikipedia ). Це означає, що регресія з розподілом помилок Лапласа оцінює медіану (наприклад, квантильну регресію), тоді як нормальна помилка стосується оцінки OLS.
Міцні пріори, про яких ви питали, були описані також Тибширані (1996), який зауважив, що міцна регресія Лассо в байєсівській обстановці еквівалентна попередньому застосуванню Лапласа. Такий попередній для коефіцієнтів орієнтований навколо нуля (з центрированими змінними) і має широкі хвости - тому більшість коефіцієнтів регресії, оцінені за його допомогою, закінчуються рівно нульовими. Це зрозуміло, якщо уважно подивитися на малюнок нижче: розподіл Лапласа має пік навколо нуля (більша маса розподілу), тоді як нормальний розподіл дифузніше навколо нуля, тому ненульові значення мають більшу масу ймовірності. Інші можливості для надійних пріорів - це Коші або - розподіли.т
Використовуючи такі пріори, ви більше схильні закінчуватись багатьма нульовими коефіцієнтами, деякими середнього розміру та деякими великими розмірами (довгий хвіст), в той час як із Normal до цього ви отримуєте більш коефіцієнти середнього розміру, які є не зовсім нульовими, але також не так далеко від нуля.
(джерело зображення Tibshirani, 1996)
Стіглер, С.М. (1986). Історія статистики: вимірювання невизначеності до 1900 року. Кембридж, Массачусетс: Belknap Press Гарвардського університетського преса.
Тібшірані, Р. (1996). Регресійна усадка та вибір через ласо. Журнал Королівського статистичного товариства. Серія B (Методологічна), 267-288.
Гельман, А., Якулін, А., Піттау, Г. М. та Су, Ю.-С. (2008). Попередньо розповсюджений за умовчанням попередній розподіл для логістичних та інших регресійних моделей. Аннали прикладної статистики, 2 (4), 1360-1383.
Нортон, RM (1984). Подвійний експоненціальний розподіл: Використання обчислення для пошуку максимального оцінювача ймовірності. Американський статистик, 38 (2): 135-136.