Один типовий випадок застосування оцінки щільності - це виявлення новинок, так само виявлення зовнішнього вигляду, де ідея полягає в тому, що ви маєте лише (або в основному) дані одного типу, але вас цікавлять дуже рідкісні, якісні чіткі дані, які суттєво відхиляються від ті поширені випадки.
Прикладами є виявлення шахрайства, виявлення несправностей у системах тощо. Це ситуації, коли дуже важко і / або дорого збирати дані того типу, який вас цікавить. Ці рідкісні випадки, тобто випадки з низькою ймовірністю виникнення.
У більшості випадків ви зацікавлені не в тому, щоб точно оцінити точний розподіл, а на відносних шансах (наскільки ймовірний, що дана вибірка є фактичною групою, а не такою).
На тему є десятки навчальних посібників та рецензій. Це один може бути хорошим , щоб почати с.
EDIT: деяким людям здається дивним, використовуючи оцінку щільності для виявлення зовнішньої форми. Давайте спочатку домовимось про одне: коли хтось підходить суміш моделі до своїх даних, він фактично проводить оцінку щільності. Модель суміші представляє розподіл ймовірності.
kNN та GMM насправді пов'язані: вони є двома методами оцінки такої щільності ймовірності. Це основна ідея багатьох підходів у виявленні новинок. Наприклад, це один на основі kNNs, цей інший основі Парзена вікна (які підкреслюють цю саму ідею на початку статті), і багатьох інших .
Мені здається (але це лише моє особисте сприйняття) більшість, якщо не всі працюють над цією ідеєю. Як ще ви б висловили ідею аномальної / рідкісної події?