Запитання з тегом «cross-validation»

Неодноразово утримуючи підмножини даних під час підгонки моделі, щоб кількісно оцінити продуктивність моделі на утриманих підмножинах даних.

2
Використання вкладеної перехресної перевірки
На сторінці Scikit Learn щодо вибору моделі згадується використання вкладеної перехресної перевірки: >>> clf = GridSearchCV(estimator=svc, param_grid=dict(gamma=gammas), ... n_jobs=-1) >>> cross_validation.cross_val_score(clf, X_digits, y_digits) Дві петлі перехресної перевірки виконуються паралельно: один за допомогою оцінювача GridSearchCV для встановлення гамми, а другий через cross_val_score для вимірювання показників прогнозування оцінювача. Отримані результати є неупередженими …

2
Інтерпретація та валідація моделі регресії коксових пропорційних небезпек за допомогою R простою англійською мовою
Чи може хтось пояснити мені свою модель Кокса простою англійською мовою? Наступну модель регресії Кокса я прилаштував до всіх своїх даних за допомогою cphфункції. Мої дані зберігаються в об'єкті, який називається Data. Змінні w, xі yє безперервними; zє фактором двох рівнів. Час вимірюється місяцями. Деяким з моїх пацієнтів відсутні дані …

1
Поїзд проти тестової помилки та її зв'язок із Overfitting: примирення конфліктних порад
Здається, що там є суперечливі поради щодо того, як поводитись із порівнянням помилок поїзда та тесту, особливо коли між ними є розрив. Здається, дві школи думок, які мені здаються конфліктними. Я шукаю, щоб зрозуміти, як примирити їх (або зрозуміти, чого мені тут не вистачає). Думка № 1: Розрив між роботою …

2
Яким чином перехресне підтвердження k-кратного розміщення вписується в контекст навчальних / перевірочних / тестових наборів?
Моє головне питання - це намагання зрозуміти, як перехресна перевірка k-кратна вписується в контекст набору навчальних / валідаційних / тестувальних наборів (якщо вона взагалі відповідає такому контексту). Зазвичай люди говорять про розбиття даних на навчальний, валідаційний та тестовий набір - скажімо, у співвідношенні 60/20/20 за курс Ендрю Нґ - при …

2
Перехресне підтвердження та оптимізація параметрів
У мене є питання щодо оптимізації параметрів, коли я використовую 10-кратну перехресну перевірку. Я хочу запитати, чи слід виправляти параметри під час тренінгу моделі кожного зразків, тобто (1) вибирати один набір оптимізованих параметрів для середньої точності кожного згину. або (2) Я повинен знайти оптимізований параметр для кожної складки, а потім …

5
Філософське запитання про логістичну регресію: чому не навчається оптимальне порогове значення?
Зазвичай при логістичній регресії ми підходимо до моделі і отримуємо деякі прогнози на навчальному наборі. Тоді ми перехресно підтверджуємо ці прогнози тренувань (щось подібне тут ) і визначаємо оптимальне порогове значення на основі чогось кривої ROC. Чому ми не включимо перехресну валідацію порогу в реальну модель і не навчимо все …

1
Оцініть випадковий ліс: OOB vs CV
Коли ми оцінюємо якість випадкового лісу, наприклад, використовуючи AUC, чи є більш доцільним обчислити ці величини за зразками з мішків або над набором перехресних перевірок? Я чую, що обчислення його через зразки OOB дає більш песимістичну оцінку, але не розумію, чому.

4
Чим перехресна перевірка відрізняється від прослуховування даних?
Я щойно закінчив "Вступ до статистичного навчання" . Мені було цікаво, чи відрізняється використання перехресної перевірки для пошуку найкращих параметрів настройки для різних методів машинного навчання, ніж провірка даних? Ми неодноразово перевіряємо, яке значення параметра налаштування призводить до найкращого прогнозного результату в тестовому наборі. Що робити, якщо параметр настройки, до …

1
За допомогою k-кратної перехресної перевірки ви оцінюєте всі
Під час виконання перехресної перевірки k-fold, я розумію, що ви отримуєте метрику точності, вказуючи всі складки, крім однієї на цю складку, і роблячи передбачення, а потім повторюйте цей процес разів. Потім ви можете запустити показники точності на всіх ваших примірниках (точність, нагадування,% класифіковано правильно), яка повинна бути такою ж, як …

2
Розуміння завантажувальної програми для перевірки та вибору моделі
Я думаю, що я розумію, як працюють основи завантаження , але я не впевнений, що розумію, як я можу використовувати завантажувальний інструмент для вибору моделі або щоб уникнути зайвого набору. Для вибору моделі, наприклад, ви б просто обрали модель, яка дає найменшу помилку (можливо, дисперсію?) У всіх зразках завантажувальної програми? …

2
Керас: чому зменшення втрат при збільшенні val_loss?
Я налаштовую пошук в сітці для групи парам. Я намагаюся знайти найкращі параметри нейронної мережі Кераса, яка робить бінарну класифікацію. Вихід або 1, або 0. Є близько 200 функцій. Коли я здійснив пошук по сітці, я отримав купу моделей та їх параметрів. Найкраща модель мала ці параметри: Epochs : 20 …

1
Як виправити неконвергенцію в LogisticRegressionCV
Я використовую scikit-learn для виконання логістичної регресії з перехресною валідністю на наборі даних (близько 14 параметрів з> 7000 нормалізованими спостереженнями). У мене також є цільовий класифікатор, який має значення або 1, або 0. Проблема в тому, що незалежно від використовуваного рішення, я продовжую отримувати попередження про конвергенцію ... model1 = …

1
Як вибрати ядро ​​для PCA ядра?
Які способи вибрати, яке ядро ​​призведе до гарного поділу даних у кінцевому виведенні даних за допомогою PCA ядра (аналіз основних компонентів), і які способи оптимізації параметрів ядра? Якщо можливо, умови Лаймана були б дуже вдячні, і посилання на документи, що пояснюють такі методи, також були б непоганими.

1
Чи є сучасні способи використання джекніфінгу?
Питання: завантажувальний процес перевершує джекніфінг; однак мені цікаво, чи є випадки, коли jackknifing є єдиним або принаймні життєздатним варіантом для визначення невизначеності оцінок параметрів. Крім того, на практичних ситуаціях, наскільки упередженим / неточним є джекніфінг відносно завантажувального завантаження, і чи можуть результати джекніфа забезпечити попереднє розуміння перед тим, як розробити …

4
Чи можете ви порівняти різні методи кластеризації на наборі даних без основної істини шляхом перехресної перевірки?
На даний момент я намагаюся проаналізувати набір даних текстових документів, які не мають основної істини. Мені сказали, що ви можете використовувати k-кратну перехресну перевірку для порівняння різних методів кластеризації. Однак у прикладах, які я бачив у минулому, використовується основна правда. Чи можна використовувати засоби k-fold на цьому наборі даних для …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.