По-перше, вибачення за розміщення питання, про яке вже обговорювались тут , тут , тут , тут , тутта для повторного розігрівання старої теми. Я знаю, що @DikranMarsupial досить довго писав про цю тему у публікаціях та журнальних статтях, але я все ще плутаюся, і, судячи з кількості подібних публікацій тут, це все ще щось, що інші намагаються зрозуміти. Я також повинен зазначити, що я отримав суперечливість на цю тему, що додало моєї розгубленості. Ви також повинні знати, що я спочатку фізик, а не статистик, тому моя доменна експертиза тут дещо обмежена. Я пишу журнал, в якому хочу використовувати вкладене резюме, щоб оцінити ефективність, яку я можу очікувати від своєї остаточної моделі. У моєму домені це перше. (Ми майже ніколи не використовуємо жодногоФорма надійного резюме в моєму полі, але весело викачуйте документи з результатами досліджень з використанням нейронних сіток та підсилених дерев рішень! помилкова процедура для моєї громади, яка могла б навчитися роками! Спасибі! Про питання ...
Як створити остаточну модель після вкладеної перехресної перевірки?
Я треную просту модель glmnet з регуляризацією L1 та L2. Це швидко, просто та інтерпретується. Я виконую перетворення центрирования, масштабування та перетворення Box-Cox, щоб розподіли зображень були середньоцентризованими, стандартизованими та дещо гауссовими. Я виконую цей крок у рамках перехресної перевірки, щоб запобігти витоку інформації. Оскільки у мене обладнання дуже повільно, і я не маю доступу до більшої кількості процесорних м'язів, я також здійснюю швидкий вибір функцій на основі фільтрів у CV після попередньої обробки функцій. Я використовую випадковий пошук сітки, щоб вибрати альфа- та лямбда-гіперпараметри. Я розумію, що не повиненЦикл CV для отримання цієї оцінки. Я розумію, що внутрішня петля CV використовується для вибору моделі (в даному випадку оптимальні гіперпараметри) і що зовнішня петля використовується для оцінки моделі , тобто внутрішня і зовнішня резюме служать двом різним цілям, які часто помилково пов'язані. (Як я роблю поки що?)
Тепер, посилання, які я розмістив, свідчать про те, що "спосіб думати про перехресну перевірку - це як оцінка продуктивності, отриманої за допомогою методу побудови моделі, а не для оцінки ефективності моделі". Враховуючи це, як я повинен інтерпретувати результати вкладеної процедури резюме?
Порада, яку я прочитав, начебто вказує на наступне --- будь ласка, виправте мене, якщо це неправильно: внутрішній резюме є частиною механізму, який дозволяє мені вибрати оптимальні альфа- та лямбда-гіперпараметри моєї моделі glmnet. Зовнішній резюме говорить про оцінку, яку я можу розраховувати отримати від кінцевої моделі, якщо застосувати процедуру точно так, як використовується у внутрішньому резюме, включаючи налаштування гіперпараметра та використання всього набору даних для побудови кінцевої моделі. Тобто настройка гіперпараметра є частиною "методу побудови моделі". Це правильно чи ні? Тому що це мене бентежить. В іншому місці я бачив, що процедура побудови кінцевої моделі для розгортання включає навчання всього набору даних за допомогою фіксованих значеньгіперпараметрів, обраних за допомогою CV. Тут «метод побудови моделі» не включає налаштування. Отже, що це? У якийсь момент оптимальні гіперпараметри вибираються та фіксуються для побудови кінцевої моделі! Де? Як? Якщо мій внутрішній цикл - це 5-кратний резюме, а зовнішній цикл - 5-кратний резюме, і я вибираю, скажімо, 100 балів для тестування як частину випадкового пошуку сітки у внутрішньому резюме, скільки разів я фактично треную glmnet модель? (100 * 5 * 5) + 1 для остаточної збірки, чи є більше кроків, про які я не знаю?
По суті, мені потрібен дуже чіткий опис того, як інтерпретувати оцінку ефективності з вкладеного резюме та як побудувати остаточну модель.
Я також хотів би знати належну процедуру вибору порогу ймовірності для перетворення балів ймовірності з моєї остаточної моделі glmnet в мітки (бінарного) класу - потрібен ще один цикл резюме?