Запитання:
- Яка різниця між деревами з посиленою регресією (BRT) та узагальненими прискореними моделями (GBM)? Чи можна їх взаємозамінно використовувати? Чи одна конкретна форма іншої?
- Чому Ріджвей використав фразу "Узагальнені прискорені регресійні моделі" (ГБМ), щоб описати те, що раніше Фрідман запропонував як "Градієнт-підсилювальна машина" (ГБМ)? Ці два абревіатури однакові, описують одне і те ж, але є похідними від різних фраз.
Фон:
У мене виникають проблеми з визначенням того, чим відрізняються терміни BRT та GBM. З того, що я розумію, обидва - це терміни для опису класифікаційних та регресійних дерев, які мають стохастичність, включену за допомогою певного прискорення (наприклад, мішок, завантаження, перехресне підтвердження). Крім того, з того, що я знаходжу, термін GBM був вперше введений Фрідманом (2001) у своїй роботі "Жадне наближення функції: машина для підвищення градієнта". Тоді Ріджвей здійснив процедуру, описану Фрідманом у 2006 році, у своєму пакеті "Узагальнені прискорені регресійні моделі" (GBM). У моїй галузі (екологія) Elith et al. (2008) був першим, хто продемонстрував gbm
пакет Ridgeway для моделювання розподілу видів. Однак автори в Elith et al. використовувати термін "прискорене регресійне дерево" (BRT) для опису Фрідмана та Риджвея "
Мене бентежить, чи можна ці терміни взаємозамінно використовувати? Дещо заплутано, що один автор використовував би той самий абревіатуру (від іншої фрази), щоб описати ту саму теорію, яку запропонував попередній автор. Також бентежить те, що третій автор використовував зовсім інший термін, описуючи цю теорію в екологічному плані.
Найкраще, що я можу придумати, - це те, що BRT є специфічною формою GBM, в якій розподіл є двочленним, але я не впевнений у цьому.
Elith та ін. Визначте прискорені регресійні дерева таким чином ... "Підсилені дерева регресії поєднують сили двох алгоритмів: регресійні дерева (моделі, що пов'язують реакцію на їх передбачувачів рекурсивними двійковими розщепленнями) та прискорення (адаптивний метод для комбінування багатьох простих моделей для покращення прогнозованої продуктивності Підсумкову модель BRT можна розуміти як модель адекватної регресії, в якій окремі терміни - це прості дерева, встановлені вперед, поетапно "(Elith et al., 2008).