На деякий час здавалося, що ядра Фішера можуть стати популярними, оскільки, здавалося, це спосіб побудувати ядра з імовірнісних моделей. Однак я рідко бачив, як вони використовуються на практиці, і я вважаю, що вони працюють не дуже добре. Вони покладаються на обчислення інформації про Фішера - цитуючи Вікіпедію:
інформація Фішера - це від'ємне очікування другої похідної відносно θ природного логарифму f. Інформація може бути визнана мірою "кривизни" кривої опори поблизу максимальної оцінки ймовірності (MLE) θ.
Наскільки я можу це сказати, це означає, що функція ядра між двома точками - це відстань уздовж цієї вигнутої поверхні - я прав?
Однак це може бути проблематичним для використання в методах ядра, як
- MLE може бути дуже поганою оцінкою для даної моделі
- Вигин кривої опори навколо MLE може не бути корисним для розмежування випадків, наприклад, якщо поверхня ймовірності була дуже піковою
- Це, здається, викидає багато інформації про модель
Якщо це так, чи є більш сучасні способи побудови ядер з імовірнісних методів? Наприклад, чи можемо ми використати набір затримань, щоб використовувати оцінки MAP таким же чином? Які ще поняття відстані чи подібності від імовірнісних методів могли б працювати для побудови (дійсної) функції ядра?