XGboost - вибір за моделлю


10

Я використовую XGboost для прогнозування цільової змінної на 2 класи щодо страхових претензій. У мене є модель (навчання з перехресною валідацією, налаштування гіпер параметрів і т. Д.), Які я запускаю на іншому наборі даних.

Моє запитання:

чи є спосіб дізнатися, чому дана претензія вплинула на один клас, тобто особливості, що пояснюють вибір, зроблений моделлю?

Метою є можливість обґрунтувати вибір, зроблений машиною, сторонній людині.

Дякую за вашу відповідь.

Відповіді:


7

Я пропоную вам піти на Shap . Він використовує значення Shapley (концепція, запозичена з Теорії ігор) для опису поведінки моделі, і за допомогою цього може пояснити єдине передбачення.

Його графічний інтерфейс використовує Force Plots, як той, який ви бачите нижче. введіть тут опис зображення

Червона смуга побудована за особливостями, що призводять прогнозування до позитивних значень, а синя - за іншими.

У вашому випадку (класифікаторі) число, що виділяється жирним шрифтом, буде таким, яке знаходиться безпосередньо перед сигмоїдною функцією, яка обмежить значення виводу між нулем і одним (один клас чи інший). Тому не лякайтеся, якщо в деяких випадках це буде більше, ніж один, або негативний.

Розмір сегментів відображає, наскільки ця функція сприяє передбаченню, а під сегментами ви бачите назву функції (наприклад, LSTAT) та її фактичне значення (напр., 4.98). Отже, у цьому випадку LSTAT є середньою характеристикою, яка приводить передбачення для цього елемента набору даних до значення 24,41 (число, виділене жирним шрифтом).

Насолоджуйтесь!


9

Ви можете використовувати бібліотеку ELI5 для пояснення внеску функцій в індивідуальні прогнози для моделей XGBoost.

Див. Пояснення прогнозів у документах, скопійованих нижче:

Щоб краще зрозуміти, як працює наш класифікатор, давайте вивчимо окремі прогнози eli5.show_prediction():

from eli5 import show_prediction
show_prediction(clf, valid_xs[1], vec=vec, show_feature_values=True)

введіть тут опис зображення


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.