% IncMSE є найбільш надійним та інформативним заходом. Це збільшення mse передбачень (оцінюється за межами КВ) в результаті перестановки змінної j (значення випадковим чином переміщуються).
- рости регресійний ліс. Обчисліть OOB-mse, назвіть це mse0.
- для 1 до j var: значення перестановки стовпця j, потім передбачити та обчислити OOB-mse (j)
- % IncMSE j'th становить (mse (j) -mse0) / mse0 * 100%
чим вище число, тим важливіше
IncNodePurance стосується функції втрат, яку вибирають найкращі розбиття. Функція втрат mse для регресії та gini-домішки для класифікації. Більше корисних змінних досягається більш високе збільшення чистоти вузла, тобто пошук розколу, який має високу "дисперсію" міжвузлів і невелику "дисперсію" внутрішнього вузла. IncNodePurance є упередженою і повинна використовуватися лише в тому випадку, якщо додатковий час обчислення для розрахунку% IncMSE неприйнятний. Оскільки для розрахунку% IncMSE потрібно лише ~ 5-25% додаткового часу, цього майже ніколи не станеться.
Подібне запитання та відповідь