Запитання з тегом «predictive-models»

Прогностичні моделі - це статистичні моделі, основною метою яких є прогнозування інших спостережень системи оптимально, на відміну від моделей, метою яких є перевірка певної гіпотези або механічне пояснення явища. Таким чином, прогностичні моделі роблять менший акцент на інтерпретації та більше акцентують на продуктивності.

2
Це сучасна методологія регресії?
Я спостерігаю за змаганнями за Kaggle довгий час, і я усвідомлюю, що багато виграшних стратегій передбачають використання принаймні однієї з "великих трійки": розстрілювання, підсилення та складання. Що стосується регресії, а не концентруватись на побудові однієї найкращої можливої ​​регресійної моделі, створюється кілька регресійних моделей, таких як (Узагальнена) лінійна регресія, випадкові лісові, …

1
Відносна змінна важливість для підвищення рівня
Я шукаю пояснення того, як обчислюється відносна змінна важливість у градієнтних підсилених деревах, що не є надто загальним / спрощеним, як: Заходи ґрунтуються на кількості вибраних змінних для розщеплення, зважених вдосконаленням у формі квадрата в результаті кожного розколу та усередненому для всіх дерев . [ Еліт та ін. 2008 р., …

6
Чи дійсно парситизм все-таки повинен бути золотим стандартом?
Просто думка: Парсимоніальні моделі завжди були типовим методом вибору моделі, але наскільки цей підхід застарів? Мені цікаво, наскільки наша тенденція до парсингу - це пережиток часу правил abaci і slide (або, що серйозніше, не сучасних комп'ютерів). Сьогоднішня обчислювальна потужність дозволяє нам будувати все більш складні моделі з все більшою здатністю …

3
Що є першопричиною проблеми дисбалансу класів?
Останнім часом я багато думав про "проблему дисбалансу класів" у машино-статистичному навчанні, і все глибше втягуюсь у відчуття, що просто не розумію, що відбувається. Спершу дозвольте мені визначити (або спробувати) визначити свої умови: Проблема дисбалансу класів у машинному / статистичному навчанні полягає в тому, що деякі алгоритми бінарної класифікації (*) …

3
чи слід змінити масштаб індикаторів / бінарних / фіктивних прогнокторів для LASSO
Для LASSO (та інших процедур вибору моделі) дуже важливо змінити масштаби прогнозів. Загальна рекомендація я дотримуюся просто використовувати 0, 1 середнє стандартне відхилення нормалізації для безперервних змінних. Але що тут робити з манекенами? Наприклад, кілька прикладних прикладів тієї ж (чудової) літньої школи, яку я пов’язував із перерахунком змінних безперервних змінних, …

2
Чому p-значення вводять в оману після поетапного вибору?
Розглянемо, наприклад, модель лінійної регресії. Я чув, що при обробці даних після поетапного відбору, заснованого на критерії AIC, оманливим є перегляд p-значень для перевірки нульової гіпотези про те, що кожен справжній коефіцієнт регресії дорівнює нулю. Я чув, що слід вважати, що всі змінні, залишені в моделі, мають справжній коефіцієнт регресії, …

1
Чи може ступінь свободи бути цілим числом?
Коли я використовую GAM, це дає мені залишковий коефіцієнт DF (останній рядок у коді). Що це означає? Виходячи за приклад GAM, загалом, чи може число ступенів свободи бути нецілим числом?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

9
Коли кореляція може бути корисною без причинного зв'язку?
Вислів домашніх тварин багатьох статистиків: "Кореляція не означає причинного зв'язку". Це, безумовно, вірно, але одне, що НЕ МАЄТЕ мається на увазі, це те, що кореляція має мало або не має значення. Це правда? Чи марно мати знання про те, що дві змінні співвідносяться? Я не уявляю, що це так. Я …

4
Прогнозування як безперервних, так і категоричних особливостей
Деякі методи моделювання прогнозування більш розроблені для роботи з безперервними прогнозами, а інші - для управління категоричними або дискретними змінними. Звичайно, існують методи перетворення одного типу в інший (дискретизація, фіктивні змінні тощо). Однак чи існують методи прогнозування моделювання, призначені для обробки обох типів введення одночасно, не просто перетворюючи тип функцій? …

1
Чи є алгоритм, що поєднує класифікацію та регресію?
Мені цікаво, чи може якийсь алгоритм одночасно робити класифікацію та регресію. Наприклад, я хотів би дозволити алгоритму вивчити класифікатор, і в той же час в межах кожної мітки він також дізнається безперервну ціль. Таким чином, для кожного прикладу навчання він має категоричну етикетку та постійне значення. Спочатку я міг би …

4
Яку проблему вирішують надмірне зондування, недооцінка та SMOTE?
У недавньому, добре сприйнятому питанні, Тім запитує, коли незбалансовані дані насправді є проблемою в машинному навчанні ? Передумова питання полягає в тому, що існує багато машинної літератури, яка обговорює баланс класів та проблему незбалансованих класів . Ідея полягає в тому, що набори даних з дисбалансом між позитивним та негативним класом …

2
Чи корисні змішані моделі в якості прогнозних моделей?
Я трохи розгублений щодо переваг змішаних моделей щодо прогнозного моделювання. Оскільки моделі прогнозування зазвичай призначені для прогнозування знань раніше невідомих спостережень, то мені здається очевидним, що єдиний спосіб, коли змішана модель може бути корисною, - це її здатність забезпечувати прогнози на рівні населення (тобто без додавання випадкових ефектів). Однак проблема …

3
Перехресне підтвердження або завантаження для оцінки ефективності класифікації?
Який найбільш відповідний метод вибірки для оцінки продуктивності класифікатора для певного набору даних та порівняння його з іншими класифікаторами? Перехресне підтвердження здається стандартною практикою, але я читав, що такі методи, як завантажувальний .632, є кращим вибором. Надалі: Чи впливає вибір метрики ефективності на відповідь (якщо я використовую AUC замість точності)? …

3
Як можна інтерпретувати матрицю плутанини Sklearn
Я використовую матрицю плутанини для перевірки працездатності мого класифікатора. Я використовую Scikit-Learn, я трохи розгублений. Як я можу інтерпретувати результат from sklearn.metrics import confusion_matrix >>> y_true = [2, 0, 2, 2, 0, 1] >>> y_pred = [0, 0, 2, 2, 0, 2] >>> confusion_matrix(y_true, y_pred) array([[2, 0, 0], [0, 0, …

2
Середня абсолютна процентна помилка (MAPE) у Scikit-learn [закрито]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для Cross Valified. Закрито 2 роки тому . Як можна обчислити середню абсолютну процентну похибку (MAPE) наших прогнозів за допомогою Python та scikit-learn? У документах у нас є лише ці …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.