інтерпретація осі y ділянок часткової залежності


22

Я читав інші теми про графіки часткової залежності, і більшість з них стосується того, як ви насправді побудуєте їх за допомогою різних пакетів, а не як ви можете їх точно інтерпретувати. Отже:

Я читав і створював неабияку кількість сюжетів часткової залежності. Я знаю, що вони вимірюють граничний вплив змінної χs на функцію ƒS (χS) із середнім впливом всіх інших змінних (χc) з моєї моделі. Вищі значення y означають, що вони мають більший вплив на точне прогнозування мого класу. Однак я не задоволений цією якісною інтерпретацією.

Це посилання показує один із моїх численних сюжетів.  http://imgur.com/RXqlOky

Моя модель (випадковий ліс) передбачає два стримані класи. "Так дерева" та "Не дерева". TRI - це змінна, яка виявилася хорошою змінною для цього.

Я почав вважати, що значення Y - це ймовірність правильної класифікації. Приклад: y (0,2) показує, що значення TRI> ~ 30 мають 20% шансів правильно визначити класифікацію True Positive.

Де навпаки

y (-0.2) показує, що значення TRI <~ 15 мають 20% шансів правильно визначити класифікацію True Negative.

Загальні інтерпретації, які зроблені в літературі, звучали б так: "Цінності, що перевищують TRI 30, починають позитивно впливати на класифікацію у вашій моделі", і все. Це звучить настільки розпливчасто і безглуздо для сюжету, що потенційно може так багато говорити про ваші дані.

Крім того, всі мої ділянки мають обмеження на відстані від -1 до 1 в межах для осі y. Я бачив інші сюжети, від -10 до 10 і т.д. Це функція від кількості класів, які ви намагаєтесь передбачити?

Мені було цікаво, чи може хтось говорити з цією проблемою. Можливо, покажіть мені, як я повинен тлумачити ці сюжети чи якусь літературу, яка може мені допомогти. Може я читаю занадто далеко в цьому?

Я дуже ретельно прочитав Елементи статистичного навчання: вилучення даних, висновок та прогнозування, і це було чудовим відправною точкою, але це стосується цього.


Діаграма показує в середньому ймовірність дерева так до TRI 30 і збільшується після цього. Це посилання пояснює, як інтерпретувати PDP-бінарну класифікацію та схеми безперервної змінної.
LazyNearestNeigbour

Відповіді:


13

Кожна точка на графіку часткової залежності - це середній відсоток голосів на користь класу "Так дерева" для всіх спостережень з урахуванням фіксованого рівня TRI.

Це не вірогідність правильної класифікації. Це абсолютно не має нічого спільного з точністю, справжніми негативами та справжніми позитивами.

Коли ви бачите фразу

Значення більше TRI 30 починають позитивно впливати на класифікацію у вашій моделі

- роздутий спосіб висловлювання

Значення більше TRI 30 починають прогнозувати "Так дерева" сильніше, ніж значення, нижчі за TRI 30


2

Функція часткової залежності в основному дає вам "середню" тенденцію цієї змінної (інтегруючи всі інші в модель). Саме форма цієї тенденції є "важливою". Ви можете інтерпретувати відносний діапазон цих графіків від різних змінних прогнозів, але не абсолютний діапазон. Сподіваюся, що це допомагає.


2

Спосіб розгляду значень осі y полягає в тому, що вони відносно один одного на інших графіках. Коли це число вище, ніж на інших графіках в абсолютних значеннях, це означає, що важливіше спричинити, що вплив цієї змінної на вихід більший.

Якщо вас цікавить математика, яка стоїть за графіками часткової залежності та як оцінюється це число, ви можете знайти їх тут: http://statweb.stanford.edu/~jhf/ftp/RuleFit.pdf розділ 8.1

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.