Поза ядрами Фішера


10

На деякий час здавалося, що ядра Фішера можуть стати популярними, оскільки, здавалося, це спосіб побудувати ядра з імовірнісних моделей. Однак я рідко бачив, як вони використовуються на практиці, і я вважаю, що вони працюють не дуже добре. Вони покладаються на обчислення інформації про Фішера - цитуючи Вікіпедію:

інформація Фішера - це від'ємне очікування другої похідної відносно θ природного логарифму f. Інформація може бути визнана мірою "кривизни" кривої опори поблизу максимальної оцінки ймовірності (MLE) θ.

Наскільки я можу це сказати, це означає, що функція ядра між двома точками - це відстань уздовж цієї вигнутої поверхні - я прав?

Однак це може бути проблематичним для використання в методах ядра, як

  1. MLE може бути дуже поганою оцінкою для даної моделі
  2. Вигин кривої опори навколо MLE може не бути корисним для розмежування випадків, наприклад, якщо поверхня ймовірності була дуже піковою
  3. Це, здається, викидає багато інформації про модель

Якщо це так, чи є більш сучасні способи побудови ядер з імовірнісних методів? Наприклад, чи можемо ми використати набір затримань, щоб використовувати оцінки MAP таким же чином? Які ще поняття відстані чи подібності від імовірнісних методів могли б працювати для побудови (дійсної) функції ядра?

Відповіді:


9

Ви маєте рацію щодо трьох питань, які ви порушили, і ваше тлумачення абсолютно правильне.

Люди розглядали інші напрямки побудови ядер з імовірнісних моделей:

Я читав їх деякий час назад (2008), не знаючи, як розвивалася ця область за останні кілька років.

Існують також імовірнісні способи зробити це; люди в біоінформатиці дивилися на динамічні типи програмування речей у просторі рядків тощо. Ці речі не завжди є PSD і мають свої проблеми.


1
jmlr.org/papers/volume10/martins09a/martins09a.pdf розробляє деяку теорію ядер, пов'язаних з розбіжністю KL, які є і не є позитивними.
Дугал
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.