Я досить новачок у випадкових лісах. У минулому я завжди порівнював точність підгонки проти тесту проти пристосування проти поїзда, щоб виявити будь-який набір. Але я просто прочитав тут таке:
"У випадкових лісах немає необхідності в перехресній валідації або в окремому наборі тесту, щоб отримати неупереджену оцінку помилки набору тестів. Оцінюється внутрішньо, під час виконання ..."
Невеликий абзац, наведений вище, можна знайти в розділі оцінки помилок "out of-bag" (oob) . Ця концепція Out of Bag Error для мене абсолютно нова, і що трохи заплутано - це те, як помилка OOB в моїй моделі становить 35% (або 65% точності), але все ж, якщо я застосую перехресну перевірку до моїх даних (просто простий затримка метод) і порівняйте обидва придатності проти тесту проти пристосування проти поїзда, я отримую 65% точність і 96% точність відповідно. На мій досвід, це вважається надмірним, але OOB має 35% помилки, як і моя помилка придатності проти тесту . Я перестарався? Чи потрібно навіть використовувати перехресну перевірку, щоб перевірити, чи не є пристосування у випадкових лісах?
Коротше кажучи, я не впевнений, чи варто мені довіряти OOB, щоб отримати неупереджену помилку помилки тестового набору, коли мій прилад проти поїзда вказує на те, що я переозброюю!