Я будую текстовий категоризатор для коротких речень. Крім того, щоб сказати користувачеві "категорія тексту, який ви ввели, це С", я хочу мати можливість пояснити, чому я прийняв таке рішення, стисло та зрозуміло. Наприклад, я не хочу сказати користувачеві: "Я поставив ваше речення в складну тришарову нейронну мережу, і це відповідь, яка набрала найкраще"; Я хочу пояснень, таких як "Ваше речення містить слова U, V і W, характерні для цієї категорії, через такі речення, як X, Y і Z, які з'явилися у навчальних даних".
Моє запитання: які алгоритми класифікації найкраще підходять для такого застосування?
k-найближчі-сусіди здаються хорошим кандидатом, тому що я можу сказати користувачеві: "У вашому реченні є категорія C, оскільки воно схоже на речення X, Y і Z, які мають одну і ту ж категорію. Але його ефективність щодо проблем категоризації тексту відома Я шукаю класифікацію, яка врівноважує продуктивність із можливістю пояснення.
EDIT: Провівши багато часу на пошук такого класифікатора, я почав будувати бібліотеку машинного навчання під назвою limdu , яка дозволяє класифікаторам пояснити свої рішення. Він ще знаходиться на стадії розробки, але це вже допомогло мені пояснити собі та колегам, чому наші класифікатори так часто виходять з ладу ...