Кульбек – Лейблер проти дистанції Колмогоров-Смірнов


37

Я можу бачити, що між відстаніми мірами Кульбека – Лейблера проти Колмогорова-Смірнова відстані між великими формальними відмінностями. Однак обидва використовуються для вимірювання відстані між розподілами.

  • Чи є типова ситуація, коли одну слід використовувати замість іншої?
  • Що обґрунтовує це?

Питання, пов’язані з цим: stats.stackexchange.com/questions/4/…
GaBorgulya

Відповіді:


23

Дивергенція KL, як правило, використовується в інформаційно-теоретичних налаштуваннях, або навіть байєсівських налаштуваннях, наприклад, для вимірювання зміни інформації між розподілами до і після застосування деяких висновків, наприклад. Це не відстань у типовому (метричному) розумінні, через відсутність симетрії та нерівності трикутника, і тому воно використовується в місцях, де спрямованість має значення.

Відстань KS зазвичай використовується в умовах непараметричного тесту. Насправді я рідко бачив, щоб він використовувався як загальне "відстань між розподілами", де відстань відстань Дженсена-Шеннона та інші відстані частіше зустрічаються.1


5
Ще одне використання KL-дивергенції, яке варто згадати, полягає у тестуванні гіпотез. Припустимо, що є проміжною мірою з щільністю або p 0, або p 1 . Нехай T n = n - 1n i = 1 лог ( p 1 ( X i ) / p 0 ( X i ) ) . За Нейманом - Пірсоном, оптимальний тест відхиляє, коли величина T n велика. Тепер під пX1,X2,p0p1Tn=n1i=1nlog(p1(Xi)/p0(Xi))Tnp0TnD(p0||p1)p1TnD(p1||p0)D(||)Tn>0p0

Справді. це відмінний приклад. І насправді в більшості загальних версій хвостових меж Чорноффа-Гоффдінга використовується KL-розбіжність.
Суреш Венкатасубраманян

2

Ще один спосіб викласти те ж саме, що і попередня відповідь у більш непростому плані:

KL Divergence - насправді дає змогу визначити, наскільки великою є різниця в двох розподілах один від одного. Як зазначалося в попередній відповіді, цей захід не є відповідною метрикою відстані, оскільки не є симетричною. Тобто відстань між розподілом A і B - це різне значення від відстані між розподілом B і A.

Тест Колмогорова-Смірнова - Це показник оцінки, який розглядає найбільшу поділу між кумулятивним розподілом тестового розподілу відносно еталонного розподілу. Крім того, ви можете використовувати цю метрику так само, як z-бал проти розподілу Колмогорова, щоб виконати тест гіпотези щодо того, чи є тестовий розподіл таким же розподілом, як еталонний. Ця метрика може використовуватися як функція відстані, оскільки вона симетрична. Тобто найбільший поділ між CDF A і CDF з B є таким самим, як найбільший поділ між CDF від B проти CDF від A.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.