Чи є спосіб відключити функцію настройки параметрів (сітки) в CARET?


15

CARET автоматично використовувати заздалегідь задану сітку налаштування для побудови різних моделей перед вибором кінцевої моделі, а потім тренінг кінцевої моделі на повних даних про навчання. Я можу забезпечити власну сітку настройки лише однією комбінацією параметрів. Однак навіть у цьому випадку CARET "вибирає" найкращу модель серед параметрів настройки (навіть якщо в цьому випадку є лише одна), а потім підходить підсумкову модель до всіх даних тренувань. Це додатковий крок, якого я хотів би уникнути.

Як просто пропустити крок пошуку моделі через різні варіанти налаштування сітки та змусити CARET будувати всі навчальні дані (крім прямого виклику базової бібліотеки моделей)?


1
Питання досить неясне, що, ймовірно, пояснює, чому ви отримали відповіді, відповідаючи на різні запитання, а саме: 1) Як я можу сказати, що пропускає пропуск валідації моделі та налаштування? і 2) Як вимкнути лише тюнінг моделі?
Йохан Ларссон

Відповіді:


17

Ви можете вказати method="none"в trainControl. Наприклад:

train(Species ~ ., data=iris, method="rf", tuneGrid=data.frame(mtry=3),
  trControl=trainControl(method="none"))

Я не впевнений, коли це було здійснено.


9

Найкращим способом було б явно поставити фрейм даних tuneGrid. Наприклад, випадковий ліс має лише один параметр настройки, 'mtry', який контролює кількість функцій, вибраних для кожного дерева.

Щоб встановити mtry на певне значення, ви можете вибрати за замовчуванням randomForest (? RandomForest):

model <- train(x = X, y = Y, method = 'rf', tuneGrid = data.frame(.mtry = M))

де M - одне значення параметра настройки, який ви бажаєте використовувати.

для кількох параметрів настройки зробіть це:

tuneGrid = data.frame(.par1 = P1, .par2 = P2, .par3 = P3)

Ласкаво просимо на наш сайт, Brent! Дякуємо, що продовжили цю стару запитання.
whuber

4
Пропозиція нижче method="none"- це краще рішення.
топепо

1

Я не думаю, що це можливо (принаймні, це було неможливо, як у кількох версіях тому). Можна зменшити вплив на продуктивність, встановивши лише один перерозподільний розділ у навчальних даних (але карета все одно тренуватиме модель двічі)

Це звучить як корисна функція, тому я би пінг писав автору пакета.


Вибачте, ця відповідь застаріла зараз
smci
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.