Запитання з тегом «model-selection»

Вибір моделі - це проблема визначити, яка модель з якогось набору працює найкраще. Популярні методи включають критерії , AIC та BIC, тестові набори та перехресну перевірку. В якійсь мірі вибір функції є підпроблемою вибору моделі. R2

6
Порівняйте R-квадрат у двох різних моделях Random Forest
Я використовую пакет randomForest в R, щоб розробити випадкову лісову модель, щоб спробувати пояснити безперервний результат у "широкому" наборі даних з більшою кількістю предикторів, ніж зразків. Зокрема, я підхоплюю одну модель РФ, яка дозволяє процедурі вибирати з набору змінних ~ 75 прогнозів, які я вважаю важливими. Я перевіряю, наскільки добре …

2
Чи існує модель, яка відповідає статистиці (наприклад, AIC або BIC), яку можна використовувати для абсолютного замість просто порівняльного порівняння?
Я не такий знайомий з цією літературою, тож пробачте мене, якщо це очевидне питання. Оскільки AIC та BIC залежать від максимізації ймовірності, видається, що їх можна використовувати лише для порівняльного порівняння між набором моделей, що намагаються підходити до заданого набору даних. Наскільки я розумію, не було б сенсу обчислювати AIC …

3
Вибір моделі Баєса і надійний інтервал
У мене є набір даних із трьома змінними, де всі змінні є кількісними. Нехай називаємо це , та . Я підганяю регресійну модель в байєсівській перспективі через MCMCуyyх1x1x_1х2x2x_2rjags Я зробив дослідницький аналіз, і розсіювання дозволяє припустити використання квадратичного терміна. Тоді я прилаштував дві моделіу×х2y×x2y\times x_2 (1)у=β0+β1∗х1+β2∗х2у=β0+β1∗х1+β2∗х2y=\beta_0+\beta_1*x_1+\beta_2*x_2 (2)у=β0+β1∗ x 1 +β2∗х2+β3∗х1х2+β4∗х21+β5∗х22у=β0+β1∗х1+β2∗х2+β3∗х1х2+β4∗х12+β5∗х22y=\beta_0+\beta_1*x1+\beta_2*x_2+\beta_3*x_1x_2+\beta_4*x_1^2+\beta_5*x_2^2 …

3
Узагальнені лінійні змішані моделі: вибір моделі
Це питання / тема з'явилася під час обговорення з колегою, і я шукав деякі думки з цього приводу: Я моделюю деякі дані за допомогою логістичної регресії випадкових ефектів, точніше випадкової логістичної регресії. Для фіксованих ефектів у мене є 9 змінних, які представляють інтерес і враховуються. Я хотів би зробити якийсь …

1
Яка модель глибокого навчання може класифікувати категорії, які не є взаємовиключними
Приклади: у мене є речення в описі посади: "Старший інженер Java у Великобританії". Я хочу використовувати модель глибокого навчання, щоб передбачити її як 2 категорії: English і IT jobs. Якщо я використовую традиційну модель класифікації, вона може передбачити лише 1 мітку з softmaxфункцією на останньому шарі. Таким чином, я можу …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Чому інформаційний критерій (не скоригований ) використовується для вибору відповідного порядку відставання у моделі часових рядів?
У моделях часових рядів, таких як ARMA-GARCH, для вибору відповідного відставання або порядку моделі використовуються різні інформаційні критерії, такі як AIC, BIC, SIC тощо. Моє запитання дуже просте, чому ми не використовуємо скоригований для вибору відповідної моделі? Ми можемо вибрати модель, яка призводить до більш високого значення скоригованого . Оскільки …

4
Інтерпретація значення AIC
Типові значення AIC, які я бачив для логістичних моделей, є тисячами, принаймні сотнями. наприклад, на http://www.r-bloggers.com/how-to-perform-a-logistic-regression-in-r/ AIC становить 727,39 Хоча завжди кажуть, що AIC слід використовувати лише для порівняння моделей, я хотів зрозуміти, що означає конкретне значення AIC. Відповідно до формули, AIC=−2log(L)+2KAIC=−2log⁡(L)+2KAIC= -2 \log(L)+ 2K Де L = максимальна ймовірність …

1
Вибір оригінальної (?) Моделі з кратним CV
Використовуючи ревізію k-кратного для вибору серед регресійних моделей, я зазвичай обчислюю похибку CV окремо для кожної моделі разом із її стандартною помилкою SE, і я вибираю найпростішу модель в межах 1 SE від моделі з найнижчою помилкою CV (1 стандартне правило помилок, див. наприклад тут ). Однак мені нещодавно сказали, …

1
Коли правильне оцінювання правила є кращою оцінкою узагальнення в класифікаційному середовищі?
Типовим підходом до вирішення проблеми класифікації є визначення класу кандидатних моделей, а потім проведення вибору моделі за допомогою певної процедури, наприклад перехресної перевірки. Зазвичай вибирають модель з найбільшою точністю або якусь пов'язану функцію, що кодує конкретну інформацію про проблему, наприклад .FβFβ\text{F}_\beta Припустимо, що кінцевою метою є створення точного класифікатора (де …

1
Еквівалентність значень AIC та p у виборі моделі
У коментарі до відповіді на це питання було зазначено, що використання AIC у виборі моделі еквівалентно використанню р-значення 0,154. Я спробував це в R, де я використав "зворотний" алгоритм вибору підмножини, щоб викинути змінні з повної специфікації. По-перше, послідовно викидаючи змінну з найвищим р-значенням і зупиняючи, коли всі p-значення нижче …

2
Яке ядро ​​SVM використовувати для проблеми бінарної класифікації?
Я початківець, коли мова йде про підтримку векторних машин. Чи є якісь вказівки, які говорять, яке ядро ​​(наприклад, лінійне, поліноміальне) найкраще підходить для конкретної проблеми? У моєму випадку я повинен класифікувати веб-сторінки відповідно до того, містять вони якусь конкретну інформацію чи ні, тобто у мене є проблема бінарної класифікації. Чи …

2
Проблема з обчисленням, інтерпретацією регістрів і загальними питаннями щодо процедури вибору моделі
Я хочу вибрати моделі, що використовують regsubsets(). У мене є кадр даних під назвою olympiadaten (дані завантажені: http://www.sendspace.com/file/8e27d0 ). Я спочатку додаю цей кадр даних, а потім починаю аналізувати, мій код: attach(olympiadaten) library(leaps) a<-regsubsets(Gesamt ~ CommunistSocialist + CountrySize + GNI + Lifeexp + Schoolyears + ExpMilitary + Mortality + PopPoverty …

4
Вибір моделі та продуктивність моделі при логістичній регресії
У мене є питання щодо вибору моделі та продуктивності моделі при логістичній регресії. У мене є три моделі, які базуються на трьох різних гіпотезах. Перші дві моделі (дозволяють назвати їх z і x) мають лише одну пояснювальну змінну в кожній моделі, а третя (дає назву w) є більш складною. Я …

1
Облік дискретних або бінарних параметрів у байєсівському критерії інформації
BIC штрафується на основі кількості параметрів. Що робити, якщо деякі параметри є певними змінними бінарних індикаторів? Чи вважають це повними параметрами? Але я можу поєднати бінарних параметрів в одну дискретну змінну, яка приймає значення в . Чи слід їх вважати параметрами або одним параметром?ммm{ 0 , 1 , . . …

4
Зменшення кількості змінних у множинній регресії
У мене є великий набір даних, що складається із значень кількох сотень фінансових змінних, які можна було б використовувати в декількох регресіях для прогнозування поведінки індексного фонду в часі. Я хотів би зменшити кількість змінних до десяти або більше, зберігаючи якомога більше прогнозних можливостей. Додано: Скорочений набір змінних повинен бути …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.