Класифікатори Naive Bayes - популярний вибір для класифікаційних проблем. Є багато причин для цього, зокрема:
- "Zeitgeist" - широке усвідомлення після успіху спам-фільтрів близько десяти років тому
- Легко писати
- Модель класифікатора швидко будується
- Модель можна модифікувати новими навчальними даними без необхідності її перебудови
Однак вони "наївні" - тобто вони вважають, що особливості незалежні - це контрастує з іншими класифікаторами, такими як класифікатори максимальної ентропії (які повільно обчислюються).
Припущення про незалежність зазвичай не можна припустити, і в багатьох (більшості?) Випадках, включаючи приклад фільтра спаму, це просто неправильно.
То чому ж класифікатор Naive Bayes як і раніше дуже добре працює в таких програмах, навіть коли функції не залежать один від одного?