Як працює прискорення?


23

Який найпростіший спосіб зрозуміти підвищення?

Чому це не підвищує дуже слабкі класифікатори "до нескінченності" (досконалості)?

Відповіді:


28

Простий англійською мовою: Якщо ваш класифікатор неправильно класифікує деякі дані, тренуйте іншу його копію головним чином на цій неправильно класифікованій частині з надією, що вона виявить щось тонке. А потім, як завжди, повторіть. На шляху існують деякі схеми голосування, які дозволяють об'єднати всі прогнози класифікаторів на розумний спосіб.

Тому що іноді це неможливо (шум просто приховує частину інформації, або її навіть немає в даних); з іншого боку, занадто сильне підвищення може призвести до надмірного оснащення.


8

Прискорення використовує усадку через параметр швидкості навчання, який у поєднанні з k- кратною перехресною валідацією, прогнозами "поза мешком" (OOB) або незалежним тестовим набором визначають кількість дерев, які слід зберігати в ансамблі.

Ми хочемо, щоб модель навчалася повільно, отже, відбувається компроміс з точки зору складності кожної окремої моделі та кількості моделей, які слід включити. Я бачив рекомендації, що ви повинні встановити рівень навчання як можна нижчий (можливо, враховуючи час для обчислення часу та місця для зберігання), в той час як складність кожного дерева слід вибирати, виходячи з того, чи дозволяється взаємодія, і в якій мірі, чим складніше дерево, тим складніші взаємодії, які можна представити.

[0,1]<0,01 ). Це зважування, яке застосовується до кожного дерева для зменшення ваги внеску кожної моделі у встановлені значення.

k -кратне резюме (або передбачення OOB або незалежний тестовий набір) використовується для визначення того, коли прискорена модель почала надмірно використовувати. По суті, саме це перешкоджає нам підніматись до ідеальної моделі, але краще вчитися повільно, щоб у нас був великий ансамбль моделей, що сприяють приталеній моделі.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.