Чому обрізка не потрібна для випадкових лісових дерев?


20

Брейман каже, що дерева вирощуються з поза обрізкою. Чому? Я маю на увазі сказати, що повинна бути вагома причина, чому дерева у випадкових лісах не обрізають. З іншого боку, дуже важливо обрізати єдине дерево рішень, щоб уникнути надмірного розміщення. Чи є література доступна для читання з цієї причини? Звичайно, дерева можуть не мати взаємозв’язку, але все-таки буде можливість переобладнання.


Тут дійсно потрібно сказати більше про контекст. @ChrisA. зробив помітну спробу, але важко дізнатися, чи справді відповіли на ваше запитання, тому що важко дізнатися багато про вашу повагу.
gung - Відновіть Моніку

2
Що ще потрібно сказати? Питання дуже зрозуміле.
Seanosapien

Відповіді:


20

Грубо кажучи, деякі випадки надмірного розміщення, які можуть трапитися на одному дереві (це загалом причина обрізки), пом'якшуються двома речами у випадковому лісі:

  1. Справа в тому, що зразки, які використовуються для тренування окремих дерев, "завантажуються".
  2. Той факт, що у вас є безліч випадкових дерев, що використовують випадкові ознаки, і, отже, окремі дерева є сильними, але не настільки співвіднесеними між собою.

Редагувати: на основі коментаря ОП нижче:

Однозначно є ще потенціал для надмірного пристосування. Що стосується статей, ви можете прочитати про мотивацію «мішковини» Бреймана та «завантаження» в цілому Ефроном та Тібшірані. Що стосується 2., Бріман вивів слабке обмеження на похибку узагальнення, пов’язану з міцністю дерева та антикореляцією окремих класифікаторів. Ніхто не використовує пов'язане (швидше за все), але це покликане дати інтуїцію про те, що допомагає низьким помилкам узагальнення в методах ансамблю. Про це йдеться у самому документі "Випадкові ліси". Моя публікація повинна була підштовхнути вас у правильному напрямку, грунтуючись на цих показаннях та моєму досвіді / відрахуванні.

  • Брейман, Л., Провідники спокусливості, машинне навчання, 24 (2), с.123-140, 1996.
  • Ефрон, Б.; Тібшірані, Р. (1993). Вступ до завантажувальної програми. Boca Raton, FL
  • Брейман, Лев (2001). «Випадкові ліси». Машинне навчання 45 (1): 5–32.

Але все ж може бути можливість переобладнання. Чи можете ви цитувати статтю для читання для цього?
Z Khan

@ Z Khan Ти, можливо, теж цей Z Khan ? Якщо це так, повідомте нас, щоб ми могли об'єднати ваші рахунки.
whuber

3
@ZKhan Проблему надмірного пристосування в РФ висвітлюється в Hastie et al, (2009) Елементи статистичного навчання, 2-е видання . На веб-сайті для книги є безкоштовний PDF-файл. Ознайомтеся з розділом про випадкові ліси.
Відновіть Моніку - Г. Сімпсон
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.