Значення осі y на графіку часткової залежності випадкової ліси


13

Я використовую RandomForestпакет R і розгублений, як інтерпретувати значення осі Y в їх часткових ділянках залежності. Документи довідки констатують, що графік - це "графічне зображення граничного ефекту змінної на ймовірність класу". Однак я все ще плутаю, що саме являє собою вісь y.

  • Зокрема, що означають негативні значення?
  • Що означає негативний вплив на точне прогнозування класу?
  • І що є найважливішою особливістю цих цифр, це максимальне значення, форма тренду тощо?
  • Чи можете ви порівняти часткові сюжети з частковими графіками інших змінних?
  • Як ці графіки можна порівняти з кривими відгуків, створеними в Maxent (програмне забезпечення для моделювання розподілу)?

Деякі приклади графіків часткової залежності

Відповіді:


7

Відповідь спочатку на ці два:

Зокрема, що означають негативні значення? Що означає негативний вплив на точне прогнозування класу?

Якщо ви подивитесь на визначення того, як обчислюється частковий графік в документації на пакет Random Forest , це говорить про те, що графіки показують відносний внесок змінної на ймовірність класу з точки зору ймовірності з точки зору моделі. Іншими словами, негативні значення (у вісі y) означають, що позитивний клас є менш імовірним для цього значення незалежної змінної (вісь x) відповідно до моделі. Аналогічно позитивні значення означають, що позитивний клас є більш імовірним для цього значення незалежної змінної відповідно до моделі. Зрозуміло, що нуль не передбачає середнього впливу на ймовірність класу відповідно до моделі.

І що є найважливішою особливістю цих цифр, це максимальне значення, форма тренду тощо?

Існує багато різних підходів до визначення важливості функції, а максимальне абсолютне значення - лише одна проста міра. Зазвичай люди дивляться на форму часткових сюжетів, щоб зібратися з розумінням того, що пропонує модель про співвідношення змінних до міток класу.

Чи можете ви порівняти часткові сюжети з частковими графіками інших змінних?

Відповідь на це менш чорно-біла. Ви можете певним чином переглянути діапазон осі у для кожної ділянки; Якщо часткова залежність від однієї змінної близька до нуля для всього діапазону змінної, це говорить про те, що модель не має ніякого відношення від змінної до мітки класу. Повертаємось до свого питання, чим більший асортимент, тим сильніший вплив в цілому, тому в цьому сенсі їх можна порівняти.

Я не маю досвіду роботи з Макентом.


Скажіть, модель розрахована на 2 класи, як визначити, який клас - це позитивний, а який - негативний?
Кумар Вайбхав

Це гарне питання, вам доведеться поекспериментувати і подивитися. У документації тут на сторінці 17 сказано, що якщо yце фактор, то передбачається, що це проблема класифікації. Однак він не говорить про те, який фактор буде відображатися на позитивний чи негативний клас. Я би сподівався, що 1 або true відображається в позитивний клас, а 0, -1, або false виявляється в негативний клас, але я б не сприйняв це як належне в Р.
Кріс А.

є which.classаргумент, partialPlotі він за замовчуванням до першого рівня фактору y. Отже, якщо перший рівень y- це негативний випадок, тоді partialPlotбуде передбачати негативні випадки, які можуть бути не такими, які очікують.
qoheleth
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.