Запитання з тегом «prediction»

Прогнозування невідомих випадкових величин за допомогою статистичної моделі.

1
Як масштабувати нові спостереження для прогнозування, коли модель оснащувалася масштабованими даними?
Я розумію поняття масштабування матриці даних для використання в лінійній регресійній моделі. Наприклад, в R ви можете використовувати: scaled.data <- scale(data, scale=TRUE) Єдине моє запитання - як правильно оцінювати нові спостереження, для яких я хочу передбачити вихідні значення? Було б scaled.new <- (new - mean(data)) / std(data),?

1
Прогнозування на моделях зі змішаним ефектом: що робити з випадковими ефектами?
Розглянемо цей гіпотетичний набір даних: set.seed(12345) num.subjects <- 10 dose <- rep(c(1,10,50,100), num.subjects) subject <- rep(1:num.subjects, each=4) group <- rep(1:2, each=num.subjects/2*4) response <- dose*dose/10 * group + rnorm(length(dose), 50, 30) df <- data.frame(dose=dose, response=response, subject=subject, group=group) ми можемо використовувати lmeдля моделювання відповіді за допомогою моделі випадкових ефектів: require(nlme) model <- …

3
Прогнозування даних підрахунку з випадковим лісом
Чи можна навчитись випадковому лісу для відповідного прогнозування даних підрахунку? Як би це діяло? У мене досить широкий діапазон значень, тому класифікація насправді не має сенсу. Якби я застосував регресію, я б просто врізав результати? Я тут зовсім загубився. Будь-які ідеї?

1
Точний тест Фішера та гіпергеометричне поширення
Я хотів краще зрозуміти точний тест Фішера, тому я розробив наступний іграшковий приклад, де f і m відповідає чоловічому та жіночому, а n і y відповідає такому "споживання соди", як це: > soda_gender f m n 0 5 y 5 0 Очевидно, це різке спрощення, але я не хотів, щоб …

1
Чи потрібна попередня обробка перед прогнозуванням за допомогою FinalModel of RandomForest з пакетом caret?
Я використовую пакет caret для навчання випадкового об'єкта Forest з 10x10CV. library(caret) tc <- trainControl("repeatedcv", number=10, repeats=10, classProbs=TRUE, savePred=T) RFFit <- train(Defect ~., data=trainingSet, method="rf", trControl=tc, preProc=c("center", "scale")) Після цього я тестую randomForest на testSet (нові дані) RF.testSet$Prediction <- predict(RFFit, newdata=testSet) Матриця плутанини показує мені, що модель не така вже …

1
Чому Netflix перейшов зі своєї п'ятизіркової системи рейтингу на систему «подобається / не подобається»?
Netflix використовував, щоб базувати свої пропозиції на рейтингах інших фільмів / шоу. Ця рейтингова система мала п'ять зірок. Тепер Netflix дозволяє користувачам подобатись / не подобатися (великі пальці вгору / великі пальці) фільми / шоу. Вони стверджують, що легше оцінювати фільми. Чи не була б ця двостороння класифікація статистично менш …

1
Інтервал прогнозування = достовірний інтервал?
Мені цікаво, чи інтервал прогнозування та достовірний інтервал оцінюють те саме. Наприклад, з лінійною регресією, коли ви оцінюєте інтервал прогнозування встановлених значень, ви оцінюєте межі інтервалу, в якому ви очікуєте падіння вашої величини. Навпаки на довірчий інтервал, ви орієнтуєтесь не на такий параметр розподілу, як середнє значення, а на значення, …

1
R нейроннет - обчислення дають постійну відповідь
Я намагаюся використовувати neuralnetпакет R (документація тут ) для прогнозування. Ось що я намагаюся зробити: library(neuralnet) x <- cbind(runif(50, min=1, max=500), runif(50, min=1, max=500)) y <- x[, 1] * x[, 2] train <- data.frame(x, y) n <- names(train) f <- as.formula(paste('y ~', paste(n[!n %in% 'y'], collapse = ' + '))) …

1
Вибір моделі ABC
Було показано , що вибір моделі ABC з використанням Байеса чинників не рекомендується з - за наявності помилки , що надходить з використання зведеної статистики. Висновок у цій роботі спирається на вивчення поведінки популярного методу апроксимації фактора Байєса (Алгоритм 2). Добре відомо, що фактори Байєса - не єдиний спосіб проведення …

2
Інтервали прогнозування та толерантності
У мене є пара запитань щодо прогнозування та інтервалів допуску. Давайте погодимось спочатку з визначенням інтервалів допусків: нам дають рівень довіри, скажімо, 90%, відсоток населення, який охоплює, скажімо, 99%, і розмір вибірки, скажімо 20. Розподіл ймовірностей відомий, скажімо, нормальний для зручності. Тепер, з огляду на три вищенаведені числа (90%, 99% …

1
R / mgcv: Чому тензорні вироби te () і ti () створюють різні поверхні?
У mgcvпакеті Rє дві функції для встановлення тензорних взаємодій між продуктами: te()і ti(). Я розумію основний розподіл праці між двома (встановлення нелінійної взаємодії проти декомпозиції цієї взаємодії на основні ефекти та взаємодію). Чого я не розумію, це чому te(x1, x2)і ti(x1) + ti(x2) + ti(x1, x2)може давати (трохи) різні результати. …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
Як обчислити показники достовірності в регресії (з випадковими лісами / XGBoost) для кожного прогнозу в R?
Чи є спосіб отримати оцінку достовірності (ми можемо назвати це також достовірністю або ймовірністю) для кожного прогнозованого значення при використанні таких алгоритмів, як Random Forests або Extreme Gradient Boosting (XGBoost)? Скажімо, цей показник довіри варіюватиметься від 0 до 1 і показує, наскільки я впевнений у певному прогнозі . З того, …

1
Прогнозування з випадковими ефектами в мгcv gam
Мене цікавить моделювання загального вилову риби з використанням гами в мгкв для моделювання простих випадкових ефектів для окремих суден (які роблять багаторазові поїздки з часом у риболовлі). У мене 98 предметів, тож я думав, що буду використовувати ген замість гамма для моделювання випадкових ефектів. Моя модель: modelGOM <- gam(TotalFish ~ …

2
Який зв’язок між причинним висновком та передбаченням?
Які взаємозв'язки та відмінності між причинним висновком та прогнозуванням (як класифікацією, так і регресією)? У контексті прогнозування маємо змінні прогноз / вхід та змінні відповідь / вихід. Чи означає це, що між вхідними та вихідними змінними існує причинний зв’язок? Отже, чи належить передбачення до причинного умовиводу? Якщо я правильно розумію, …

2
"Значна змінна", яка не покращує позапробні прогнози - як інтерпретувати?
У мене виникає питання, яке, на мою думку, буде досить основним для багатьох користувачів. Я використовую лінійні регресійні моделі для (i) дослідження взаємозв'язку декількох пояснювальних змінних та моєї змінної відповіді та (ii) передбачення моєї змінної відповіді за допомогою пояснювальних змінних. Здається, одна конкретна пояснювальна змінна X значно впливає на мій …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.