Чи є література, що перераховує характеристики алгоритмів, які дозволяють пояснити їх?
Єдина мені відома література - це нещодавній документ Ріберо, Сінгха та Гостріна. Вони спочатку визначають пояснення одного прогнозу:
Під "поясненням передбачення" ми маємо на увазі подання текстових чи візуальних артефактів, які забезпечують якісне розуміння взаємозв'язку між компонентами екземпляра (наприклад, словами в тексті, виправленнями на зображенні) та прогнозуванням моделі.
Автори далі розглядають, що це означає для конкретніших прикладів, а потім використовують це поняття для визначення пояснення моделі. Їх мета полягає в тому, щоб спробувати і так би мовити штучно додати пояснення до інакше непрозорих моделей, а не порівнювати пояснення існуючих методів. Документ може бути корисним, оскільки намагається ввести більш точну термінологію навколо поняття "пояснюваність".
Чи існують загальноприйняті моделі машинного навчання, які представляють гарний компроміс між ними?
Я погоджуюся з @Winter, що еластична сітка для (не тільки логістичної) регресії може розглядатися як приклад хорошого компромісу між точністю прогнозування та пояснюваністю.
Для іншого типу додатків (часових рядів) ще один клас методів також пропонує хороший компроміс: Байєсське моделювання структурних часових рядів. Це успадковує пояснення від класичного структурного моделювання часових рядів та деяку гнучкість від байєсівського підходу. Подібно до логістичної регресії, поясненню допомагають рівняння регресії, які використовуються для моделювання. Дивіться цей документ для приємного застосування в маркетингу та додаткових посилань.
Пов’язаний із щойно згаданим байєсівським контекстом, ви також можете переглянути імовірнісні графічні моделі. Їх пояснюваність не спирається на рівняння регресії, а на графічні способи моделювання; дивіться "Імовірнісні графічні моделі: принципи та методи" Коллера та Фрідмана для чудового огляду.
Я не впевнений, чи можемо ми називати байєсівські методи вище «загальноприйнятим добрим компромісом». Вони можуть бути недостатньо відомими для цього, особливо порівняно з прикладом еластичної сітки.