Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

2
Аналіз зміни точки за допомогою Rs nls ()
Я намагаюся здійснити аналіз "точки зміни" або багатофазну регресію за допомогою nls()Р. Ось кілька фальшивих даних, які я зробив . Формула, яку я хочу використати для пристосування даних, така: у= β0+ β1x + β2max ( 0 , x - δ)у=β0+β1х+β2макс(0,х-δ)y = \beta_0 + \beta_1x + \beta_2\max(0,x-\delta) Що потрібно зробити, це …

2
Яку міру помилки в навчанні повідомити про випадкові ліси?
Наразі я підганяю випадкові ліси для проблеми класифікації, використовуючи randomForestпакунок на R, і не знаю, як повідомити про помилку навчання для цих моделей. Моя помилка тренінгу близька до 0%, коли я обчислюю її за допомогою передбачень, які я отримую за допомогою команди: predict(model, data=X_train) де X_trainдані про навчання. Відповідаючи на …

2
Як побудувати межу рішення в R для логістичної регресійної моделі?
Я зробив логістичну регресійну модель, використовуючи glm в R. У мене є дві незалежні змінні. Як я зможу побудувати межу рішення моєї моделі в діаграмі розкидання двох змінних. Наприклад, як можна побудувати фігуру на зразок: http://onlinecourses.science.psu.edu/stat557/node/55 Спасибі.
16 r  logistic 

3
Як `predict.randomForest` оцінює ймовірності класу?
Як randomForestоцінює ймовірність класу пакетів, коли я використовую predict(model, data, type = "prob")? Я використовував rangerдля навчання випадкових лісів, використовуючи probability = Tаргумент для прогнозування ймовірностей. rangerв документації говорить, що це: Вирощувати ймовірнісні ліси, як у Malley et al. (2012 р.). Я імітував деякі дані і спробував обидва пакети та …

1
Який багаторазовий метод порівняння використовувати для lmer-моделі: lsmeans або glht?
Я аналізую набір даних, використовуючи модель змішаних ефектів з одним фіксованим ефектом (умовою) та двома випадковими ефектами (учасник, обумовлений в рамках проекту та пари). Модель була згенерована з lme4пакетом: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Далі я провів перевірку коефіцієнта ймовірності цієї моделі проти моделі без фіксованого ефекту (умови) і маю суттєву різницю. У моєму …

3
Використання glm () в якості заміни для простого тесту на квадрат чі
Мені цікаво змінити нульові гіпотези за допомогою glm() Р. Наприклад: x = rbinom(100, 1, .7) summary(glm(x ~ 1, family = "binomial")) перевіряє гіпотезу, що p=0.5p=0.5p = 0.5 . Що робити, якщо я хочу змінити нуль на ppp = якесь довільне значення, усередині glm()? Я знаю , що це може бути …

1
Як підібрати змішану модель із змінною відповіді між 0 та 1?
Я намагаюся використати lme4::glmer()для встановлення біноміальної узагальненої змішаної моделі (GLMM) із залежною змінною, яка є не бінарною, а суцільною змінною між нулем та одиницею. Можна вважати цю змінну як ймовірність; насправді це ймовірність того, як повідомили людських суб'єктів (в експерименті , який я допомогти аналізує). Тобто це не "дискретна" частка, …

4
Точність машини для підвищення градієнта зменшується зі збільшенням кількості ітерацій
Я експериментую з алгоритмом машини для підвищення градієнта через caretпакет в Р. Використовуючи невеликий набір даних про вступ до коледжу, я застосував такий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
Складання математичного рівняння для багаторівневої моделі змішаних ефектів
Питання CV Я намагаюся дати (a) детальне та стисле математичне зображення моделей змішаних ефектів. Я використовую lme4пакет у Р. Яке правильне математичне подання для моєї моделі? Дані, наукове запитання та код R Мій набір даних складається з видів у різних регіонах. Я перевіряю, чи змінюється розповсюдженість видів у часі, що …

2
Прогнози моделі BSTS (в R) повністю провалюються
Прочитавши цю публікацію в блозі про моделі байесівських структурних часових рядів, я хотів розглянути її реалізацію в контексті проблеми, для якої раніше використовував ARIMA. У мене є деякі дані з деякими відомими (але галасливими) сезонними компонентами - це, безумовно, щорічні, щомісячні та щотижневі компоненти, а також деякі наслідки внаслідок особливих …
15 r  time-series  bayesian  mcmc  bsts 

1
Розуміння QR-декомпозиції
У мене є відпрацьований приклад (в R), який я намагаюся зрозуміти далі. Я використовую Limma для створення лінійної моделі, і я намагаюся зрозуміти, що відбувається крок за кроком у розрахунках зміни складок. Я в основному намагаюся розібратися, що відбувається для обчислення коефіцієнтів. З того, що я можу зрозуміти, QR-декомпозиція використовується …

1
Чи використовує випадковий ліс Бреймана посилення інформації або індекс Джині?
Мені хотілося б знати, чи використовує випадковий ліс Бреймана (випадковий ліс у пакеті R randomForest) як критерій розщеплення (критерій вибору атрибутів) посилення інформації або індекс Джині? Я спробував це знайти на http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm та в документації для пакету randomForest в R. Але єдине, що я знайшов - це те, що індекс …

2
Як підібрати модель суміші для кластеризації
У мене є дві змінні - X і Y, і мені потрібно зробити кластер максимальним (і оптимальним) = 5. Давайте ідеальний сюжет змінних такий: Я хотів би зробити з цього 5 кластерів. Щось на зразок цього: Тому я думаю, що це суміш з 5 кластерами. Кожен кластер має центральну точку …

1
Яка інтуїція за обмінними зразками під нульовою гіпотезою?
Перестановочні тести (також називаються тестом рандомизації, тестом на повторну рандомізацію або точним тестом) дуже корисні і корисні, коли припущення про нормальний розподіл, необхідне, наприклад, t-testне виконується, і при перетворенні значень за ранжуванням непараметричний тест, як-от Mann-Whitney-U-test, призведе до втрати більше інформації. Однак одне і єдине припущення не слід оминути увагою …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
Інтерпретація змінних графіків трасування LASSO
Я новачок у glmnetпакеті, і досі не знаю, як інтерпретувати результати. Може хто-небудь, будь ласка, допоможе мені прочитати наступний сюжетний сюжет? Графік отримували, виконавши наступне: library(glmnet) return <- matrix(ret.ff.zoo[which(index(ret.ff.zoo)==beta.df$date[2]), ]) data <- matrix(unlist(beta.df[which(beta.df$date==beta.df$date[2]), ][ ,-1]), ncol=num.factors) model <- cv.glmnet(data, return, standardize=TRUE) op <- par(mfrow=c(1, 2)) plot(model$glmnet.fit, "norm", label=TRUE) plot(model$glmnet.fit, "lambda", …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.