Хто-небудь може пояснити різницю між RandomForestClassifier та ExtraTreesClassifier у scikit learn. Я витратив чимало часу на читання газет:
П. Гертс, Д. Ернст. Та Л. Вегенкель, “Надзвичайно рандомізовані дерева”, Машинне навчання, 63 (1), 3-42, 2006
Здається, це різниця для ET:
1) При виборі змінних під час поділу вибірки відбираються з усього навчального набору, а не зразка завантажувального набору навчального набору.
2) Розбиття вибираються повністю випадковим чином із діапазону значень у вибірці при кожному розбитті.
Результатом цих двох речей є набагато більше «листя».