Чи використовує випадковий ліс Бреймана посилення інформації або індекс Джині?


15

Мені хотілося б знати, чи використовує випадковий ліс Бреймана (випадковий ліс у пакеті R randomForest) як критерій розщеплення (критерій вибору атрибутів) посилення інформації або індекс Джині? Я спробував це знайти на http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm та в документації для пакету randomForest в R. Але єдине, що я знайшов - це те, що індекс Джині можна використовувати для обчислення з різною важливістю.


Мені також цікаво, чи дерева випадкових лісів у пакеті randomForest є бінарними чи ні.
хтось

Відповіді:


16

Пакет randomForest в R від A. Liaw - це порт вихідного коду, що представляє собою суміш c-коду (перекладеного), який залишився код fortran та код R обгортки. Для вирішення загального найкращого поділу на точки перерви та між змінними mtry, код використовує функцію оцінки, схожу на gini-посилення:

GiniГаiн(N,Х)=Гiнi(N)-|N1||N|Гiнi(N1)-|N2||N|Гiнi(N2)

ХNN1N2N|.|

Гiнi(N)=1-к=1Кpк2К

Гiнi(N)

|N2||N|Гiнi(N2)|N2|Гiнi(N2)=|N2|(1-к=1Кpк2)=|N2|нcласс2,к2|N2|2

нcласс1,к|N2|

1-

|N1|к=1Кp1,к2+|N2|к=1Кp2,к2=|N1|к=1Кнcласс1,к2|N1|2+|N2|к=1Кнcласс2,к2|N2|2 =к=1Кнcласс2,к21|N1|-1+к=1Кнcласс2,к21|N1|-2 =номiнатоr1/геномiнатоr1+номiнатоr2/геномiнатоr2

Реалізація також дозволяє здійснювати класичне зважування зразків вгору / вниз. Також дуже важливо, коли впровадження оновлення цього модифікованого gini-посилення, переміщення одного зразка з одного вузла в інший є дуже ефективним. Зразок можна віднести від номінаторів / знаменників одного вузла та додати до інших. Я писав прототип-RF кілька місяців тому, необізнано перераховуючи з нуля gini-посилення для кожного перелому, і це було повільніше :)

Якщо кілька балів за розділення найкращі, вибирається випадковий переможець.

Ця відповідь ґрунтувалася на перевірці вихідного файлу "randomForest.xxtar.gz / src / classTree.c" рядка 209-250

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.