Які алгоритми пакетування гідні наступників Random Forest?


14

Щодо прискорення алгоритмів, я б сказав, що вони розвивалися досить добре. На початку 1995 року була представлена ​​AdaBoost, потім через деякий час це була градієнтна машина для підсилення (GBM). Нещодавно, близько 2015 року, було представлено XGBoost, який є точним, справляється з оснащенням і став переможцем кількох змагань Kaggle. У 2017 році компанія LightGBM була представлена ​​компанією Microsoft, вона пропонує значно менший час навчання порівняно з XGBoost. Також CatBoost був представлений Яндексом для обробки категоричних особливостей.

Випадковий ліс був введений на початку 2000-х, але чи були в ньому гідні наступники? Я думаю, якби існував кращий алгоритм розробки, ніж Random Forest (який можна легко застосувати на практиці), він би привернув певну увагу в таких місцях, як Kaggle. Крім того, чому підсилення стало більш популярною технікою ансамблю, це тому, що ви можете побудувати менше дерев для оптимального прогнозування?


1
adaBoost насправді був представлений у 1995 році, але це незначний момент, який не змінює вашої основної тези.
jbowman

3
З випадкових лісів ми також бачили введення надзвичайно рандомізованих дерев , хоча я насправді не знаю жодних добрих доказів того, що ці переважають випадкові ліси з будь-якою послідовністю, тому вони можуть бути не "гідним" наступником ...
Джейк Westfall

1
BART ( arxiv.org/abs/0806.3286 ) - байесівська модель, що розвинулася з байєсівської CART з єдиного дерева та натхненна класичними методами ансамблю. Варто вивчити.
Дзен

прискорення стало більш популярним, оскільки воно успішно справляється з багатьма проблемами зі слабкими методами навчання
Refael

Регламентовані жадібні ліси можна було б згадати (повільні, але хороші результати) та кількісні випадкові ліси для їх крутих побічних ефектів.
Майкл М

Відповіді:


3

xgboost, catboost та lightgbm використовують деякі особливості випадкового лісу (випадкова вибірка змінних / спостережень), тому я думаю, що вони є продовжувачем прискорення та RF разом і беруть найкращі речі з обох. ;)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.