Запитання з тегом «outliers»

Зовнішній вигляд - це спостереження, яке видається незвичним або недостатньо добре описаним щодо простої характеристики набору даних. Неприємна можливість полягає в тому, що ці дані походять від іншої сукупності, ніж та, яка призначена для вивчення.

4
Чи можна залишити дані досліджень, оскільки вони не є суттєвими?
Я зіткнувся з цим реченням, читаючи статтю на sciencemag.org . Зрештою, було включено відповіді лише 7600 дослідників у 12 країнах, оскільки решта даних не вважалися статистично значимими. Це правильний спосіб проведення досліджень? Не залишати результатів, оскільки їх не вважали статистично значимими?

4
Чи має значення змінний порядок у лінійній регресії
Я досліджую взаємодію між двома змінними (х1х1x_1 і х2х2x_2). Між цими змінними існує велика лінійна кореляціяr > 0,9r>0,9r>0.9. Із природи проблеми я нічого не можу сказати про причинно-наслідкову ситуацію (чи є)х1х1x_1 причини х2х2x_2або навпаки). Мені хотілося б вивчити відхилення від лінії регресії, щоб виявити людей, що переживають людину. Для цього …

5
Автоматичне визначення порогу для виявлення аномалії
Я працюю з тимчасовим рядом балів аномалій (фон - виявлення аномалії в комп'ютерних мережах). Щохвилини я отримую оцінку аномалії яка говорить про те, наскільки "несподіваним" чи ненормальним є поточний стан мережі. Чим вище оцінка, тим більше ненормальним є поточний стан. Теоретично можливі оцінки, близькі до 5, але майже ніколи не …

2
Обчисліть криву ROC для даних
Отже, у мене є 16 випробувань, в яких я намагаюся ідентифікувати людину з біометричної ознаки за допомогою дистанції Hamming. Мій поріг встановлено на 3,5. Мої дані нижче, і лише пробна версія 1 - справжнє Позитивне: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.