Випадковий ліс являє собою сукупність дерев рішень , сформованих випадковим чином вибираючи тільки певні функції для побудови кожного дерева з (а іноді і розфасовці тренувальну дані). Мабуть, вони добре навчаються та узагальнюють. Хтось робив відбір проб MCMC у просторі дерева рішень чи порівнював їх із випадковими лісами? Я знаю, що запустити MCMC і зберегти всі вибірки дерев може бути обчислювально дорожче, але мене цікавлять теоретичні особливості цієї моделі, а не обчислювальні витрати. Я маю на увазі щось таке:
- Побудуйте дерево випадкових рішень (це, мабуть, буде жахливо)
- Обчислити ймовірність того , що дерево що - щось на зразок , або , можливо , додати Р р г я про г ( Т г е е ) термін.
- Виберіть випадковий крок для зміни дерева та виберіть на основі ймовірності .
- Кожні N кроків збережіть копію поточного дерева
- Поверніться до 3 протягом кількох великих N * M разів
- Використовуйте колекцію M збережених дерев для прогнозування
Чи це дало б схожу ефективність з випадковими лісами? Зауважте, що тут ми не відкидаємо хороших даних чи особливостей на будь-якому кроці на відміну від випадкових лісів.