Запитання з тегом «gbm»

Сімейство алгоритмів, що поєднують слабо прогностичні моделі в сильно прогностичну модель. Найбільш поширений підхід називається збільшенням градієнта, а найчастіше слабкими моделями є дерева класифікації / регресії.

2
Інтуїтивно зрозумілі розбіжності між градієнтними підсилюючими деревами (ГБМ) та Адабоостом
Я намагаюся зрозуміти відмінності між GBM та Adaboost. Це те, що я зрозумів поки що: Існують обидва алгоритму підвищення, який вивчає помилки попередньої моделі і, нарешті, складає зважену суму моделей. GBM і Adaboost дуже схожі за винятком функцій втрат. Але все одно мені важко схопити уявлення про відмінності між ними. …
48 boosting  gbm  adaboost 


5
Що означає глибина взаємодії в ГБМ?
У мене виникло питання про параметр глибини взаємодії в gbm в R. Це може бути питання noob, за яке я вибачаюся, але як параметр, який, на мою думку, позначає кількість кінцевих вузлів у дереві, в основному вказує X-шлях взаємодія між предикторами? Просто намагаюся зрозуміти, як це працює. Крім того, я …

1
Роль параметра n.minobsinnode GBM в R [закрито]
Це питання навряд чи допоможе майбутнім відвідувачам; це стосується лише невеликої географічної області, конкретного моменту часу або надзвичайно вузької ситуації, яка загалом не застосовується до світової аудиторії Інтернету. Для отримання додаткової інформації щодо цього питання відвідайте довідковий центр . Закрито 7 років тому . Мені хотілося знати, що означає параметр …
21 r  gbm 

3
XGBoost проти Python Sklearn сприяв збільшенню дерев
Я намагаюся зрозуміти, як працює XGBoost. Я вже розумію, як підсилені градієнти дерева працюють на склеарні Python. Що мені незрозуміло, це якщо XGBoost працює однаково, але швидше або якщо існують принципові відмінності між ним та реалізацією python. Коли я прочитав цей документ http://learningsys.org/papers/LearningSys_2015_paper_32.pdf Мені здається, що кінцевий результат, що виходить …

2
Чи страждає класифікація GBM від незбалансованих розмірів класів?
Я маю справу з контрольованим питанням бінарної класифікації. Я хотів би використовувати пакет GBM для класифікації людей як незаражених / інфікованих. У мене в 15 разів більше незаражених, ніж заражених. Мені було цікаво, чи страждають моделі GBM у разі незбалансованих розмірів класу? Я не знайшов жодних посилань, що відповідали б …

4
Точність машини для підвищення градієнта зменшується зі збільшенням кількості ітерацій
Я експериментую з алгоритмом машини для підвищення градієнта через caretпакет в Р. Використовуючи невеликий набір даних про вступ до коледжу, я застосував такий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

4
Інтервали прогнозування алгоритмів машинного навчання
Я хочу знати, чи описаний нижче процес є дійсним / прийнятним та чи є доступне обґрунтування. Ідея: контрольовані алгоритми навчання не передбачають базових структур / розподілів даних. Наприкінці дня вони виводять оціночні показники. Я сподіваюся якось кількісно оцінити невизначеність оцінок. Тепер процес побудови моделі ML є по своїй суті випадковим …

1
Пакет GBM проти Caret з використанням GBM
Я налаштовував модель за допомогою caret, але потім повторно запустив модель за допомогою gbmпакета. Наскільки я розумію, що caretпакет використовує gbmі вихід повинен бути однаковим. Однак, лише швидкий тестовий пробіг із застосуванням data(iris)показує невідповідність моделі приблизно 5%, використовуючи RMSE і R ^ 2 в якості метрики оцінювання. Я хочу знайти …

1
Як знайти інтервал прогнозування GBM
Я працюю з моделями GBM, використовуючи пакет caret і шукаю спосіб вирішити інтервали передбачення для моїх прогнозованих даних. Я широко шукав, але придумав лише кілька ідей, щоб знайти інтервали передбачення для Random Forest. Будь-який код допомоги / R буде дуже вдячний!

4
Як вибрати кількість дерев в узагальненій моделі посиленої регресії?
Чи існує стратегія вибору кількості дерев в ГБМ? Зокрема, ntreesаргумент у R's gbmфункції. Я не бачу, чому ви не повинні встановлювати ntreesмаксимальне розумне значення. Я помітив, що більша кількість дерев явно знижує мінливість результатів від кількох ГБМ. Я не думаю, що велика кількість дерев призведе до надмірного вбрання. Будь-які думки?

1
Повторне прискорення регресійних дерев (BRT), узагальнених моделей з підсиленням (GBM) та машини для підвищення градієнта (GBM)
Запитання: Яка різниця між деревами з посиленою регресією (BRT) та узагальненими прискореними моделями (GBM)? Чи можна їх взаємозамінно використовувати? Чи одна конкретна форма іншої? Чому Ріджвей використав фразу "Узагальнені прискорені регресійні моделі" (ГБМ), щоб описати те, що раніше Фрідман запропонував як "Градієнт-підсилювальна машина" (ГБМ)? Ці два абревіатури однакові, описують одне …

2
Як знайти оптимальні значення параметрів налаштування у збільшити дерева?
Я усвідомлюю, що в моделі прискорення дерев є 3 параметри настройки, тобто кількість дерев (кількість ітерацій) параметр усадки кількість розщеплень (розмір кожного складового дерева) Моє запитання: як для кожного з параметрів настройки я повинен знайти його оптимальне значення? А який метод? Зауважте: параметр усадки та кількість параметрів дерев працюють разом, …

3
Як використовувати R gbm з розподілом = "adaboost"?
Документація стверджує, що R gbm з розподілом = "adaboost" може використовуватися для задачі класифікації 0-1. Розглянемо наступний фрагмент коду: gbm_algorithm <- gbm(y ~ ., data = train_dataset, distribution = "adaboost", n.trees = 5000) gbm_predicted <- predict(gbm_algorithm, test_dataset, n.trees = 5000) Її можна знайти в документації, яка передбачає.gbm Повертає вектор прогнозів. …
9 r  gbm 
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.