Запитання з тегом «cross-validation»

Неодноразово утримуючи підмножини даних під час підгонки моделі, щоб кількісно оцінити продуктивність моделі на утриманих підмножинах даних.

1
R / mgcv: Чому тензорні вироби te () і ti () створюють різні поверхні?
У mgcvпакеті Rє дві функції для встановлення тензорних взаємодій між продуктами: te()і ti(). Я розумію основний розподіл праці між двома (встановлення нелінійної взаємодії проти декомпозиції цієї взаємодії на основні ефекти та взаємодію). Чого я не розумію, це чому te(x1, x2)і ti(x1) + ti(x2) + ti(x1, x2)може давати (трохи) різні результати. …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
Питання про віднімання середнього значення на поїзді / дійсному / тестовому комплекті
Я роблю попередню обробку даних і після цього збираюся створювати конвонети на своїх даних. Моє запитання: Скажіть, у мене є загальний набір даних зі 100 зображеннями, я обчислював середнє значення для кожного з 100 зображень, а потім віднімав його з кожного з зображень, потім розділяв це на набір поїздів і …

1
Коли не використовувати перехресну перевірку?
Коли я читаю на сайті, більшість відповідей свідчать про те, що крос-валідація повинна здійснюватися в алгоритмах машинного навчання. Однак, читаючи книгу "Розуміння машинного навчання", я побачив, що існує вправа, що іноді краще не використовувати перехресну перевірку. Я справді розгублений. Коли алгоритм тренінгу для всіх даних кращий, ніж перехресне підтвердження? Чи …

1
Випадкова регресія Лісу для прогнозування часових рядів
Я намагаюся використовувати регресію РФ для прогнозування ефективності роботи паперового комбінату. Я маю дані за хвилиною за хвилиною для вхідних даних (швидкість і кількість деревної маси, що надходить в т. Д.), А також про продуктивність машини (виготовлений папір, потужність, намальована машиною), і я хочу зробити прогнози 10 хвилин вперед щодо …

1
Як зробити перехресну перевірку cv.glmnet (регресія LASSO в R)?
Мені цікаво, як правильно підійти до навчання та тестування моделі LASSO, використовуючи glmnet в R? Зокрема, мені цікаво, як це зробити, якщо відсутність зовнішнього набору даних тесту потребує використання я перехресної перевірки (або іншого подібного підходу) для тестування моєї моделі LASSO. Дозвольте мені розбити свій сценарій: У мене є лише …

3
Чому в резюме оцінюється тестова помилка Недооцінка фактичної помилки тесту?
Наскільки я розумію, що оцінка перехресної перевірки k-кратної помилки тесту зазвичай недооцінює фактичну помилку тесту. Я розгублений, чому це так. Я бачу, чому помилка навчання зазвичай нижча, ніж помилка тесту - адже ви тренуєте модель за тими самими даними, на яких ви оцінюєте помилку! Але це не так для перехресної …

1
Запобігання відбору зразків важливої ​​важливості Pareto (PSIS-LOO) не виходить з ладу
Нещодавно я почав використовувати випробування з виборкою важливістю Pareto важливої ​​вибіркової перехресної перевірки (PSIS-LOO), описаної в цих роботах: Vehtari, A., & Gelman, A. (2015). Парето вирівнював важливість вибірки. додрук arXiv ( посилання ). Vehtari, A., Gelman, A., & Gabry, J. (2016). Практичне оцінювання байесівської моделі з використанням перехресної валідації "відключення" …

1
Які методи існують для налаштування гіперпараметрів ядра графіку SVM?
У мене є деякі дані, які існують на графіку . Вершини належать до одного з двох класів y i ∈ { - 1 , 1 } , і мені цікаво навчати SVM для розмежування двох класів. Одним відповідним ядром для цього є дифузійне ядро , K = exp ( - …

1
Чи потребує моделювання з випадковими лісами перехресне підтвердження?
Наскільки я бачив, думки щодо цього зазвичай відрізняються. Найкраща практика, безумовно, диктує використання перехресної перевірки (особливо якщо порівнювати радіочастотні сигнали з іншими алгоритмами на тому ж наборі даних). З іншого боку, першоджерело зазначає, що обчислюється похибка OOB під час навчання моделі є достатньою для показника продуктивності тестового набору. Навіть Тревор …

2
Як вибрати розміри навчальних, перехресних перевірок та тестових наборів для малих даних про розмір вибірки?
Припустимо, у мене невеликий розмір вибірки, наприклад N = 100, і два класи. Як я повинен вибрати розміри навчальних, перехресних перевірок та тестових наборів для машинного навчання? Я б інтуїтивно вибирав Розмір тренувального набору - 50 Перехресне встановлення набору розміром 25 та Розмір тесту - 25. Але, мабуть, це має …

1
Чи валідація витримки є кращим наближенням "отримання нових даних", ніж резюме в k-кратному стані?
Я переосмислював відповідь, яку я дав на питання пару тижнів тому Перехресне підтвердження витримки виробляє єдиний тестовий набір, який можна повторно використовувати для демонстрації. Ми всі, мабуть, погоджуємось, що це багато в чому негативна особливість, оскільки один витриманий набір може виявитися нерепрезентативним через випадковість. Більше того, ви можете закінчити перевищення …

2
Перевага LASSO над вибором / усуненням вперед в плані похибки прогнозування перехресної перевірки моделі
Я отримав три зменшених моделі від оригінальної повної моделі за допомогою прямий вибір зворотне усунення Техніка пеналізації L1 (LASSO) Для моделей, отриманих за допомогою вибору вперед / усунення вперед, я отримав перехресну перевірену оцінку помилки прогнозування за допомогою CVlmпакету, DAAGдоступного в R. Для моделі, обраної через LASSO, я використовував cv.glm. …

3
Чи повинен вибір функції проводитися лише на даних про навчання (або на всіх даних)?
Чи повинен підбір функції проводитись лише на даних про навчання (або всіх даних)? Я пройшов деякі дискусії та документи, такі як Гайон (2003) та Сінгхі та Лю (2006) , але все ще не впевнений у правильній відповіді. Моя установка експерименту така: Набір даних: 50 здорових груп контролю та 50 пацієнтів …

1
Порівняння розподілів продуктивності узагальнення
Скажіть, що у мене є два методи навчання проблеми класифікації , і , і я оцінюю їх узагальнюючу ефективність чимось на зразок повторної перехресної перевірки або завантаження. З цього процесу я отримую розподіл балів та для кожного методу через ці повтори (наприклад, розподіл значень AUC ROC для кожної моделі).Б П …

1
Як я можу включити інноваційний зовнішній вигляд під спостереження 48 у свою модель ARIMA?
Я працюю над набором даних. Після використання деяких методів ідентифікації моделі я вийшов із моделлю ARIMA (0,2,1). Я використав detectIOфункцію в пакеті TSAв R, щоб виявити інноваційний зовнішній вигляд (IO) під час 48-го спостереження за моїм оригінальним набором даних. Як я включу цей зовнішній вигляд у свою модель, щоб я …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.