Запитання з тегом «outliers»

Зовнішній вигляд - це спостереження, яке видається незвичним або недостатньо добре описаним щодо простої характеристики набору даних. Неприємна можливість полягає в тому, що ці дані походять від іншої сукупності, ніж та, яка призначена для вивчення.

5
Як виправити колишніх виявлених людей для прогнозування даних часових рядів?
Я намагаюся знайти спосіб виправлення інших людей, коли я знаходжу / виявляю їх у даних часових рядів. Деякі методи, такі як nnetar в R, дають деякі помилки для часових рядів з великими / великими залишками. Мені вже вдалося виправити пропущені значення, але люди, які переживають, все ще шкодять моїм прогнозам …

2
Виявлення аномалії: який алгоритм використовувати?
Контекст: Я розробляю систему, яка аналізує клінічні дані, щоб відфільтрувати неправдоподібні дані, які можуть бути помилковими. Що я робив до цього часу: Для кількісної оцінки правдоподібності моєю спробою поки що була нормалізація даних, а потім обчислення значення правдоподібності для точки p на основі її відстані до відомих точок даних у …

1
Як я можу включити інноваційний зовнішній вигляд під спостереження 48 у свою модель ARIMA?
Я працюю над набором даних. Після використання деяких методів ідентифікації моделі я вийшов із моделлю ARIMA (0,2,1). Я використав detectIOфункцію в пакеті TSAв R, щоб виявити інноваційний зовнішній вигляд (IO) під час 48-го спостереження за моїм оригінальним набором даних. Як я включу цей зовнішній вигляд у свою модель, щоб я …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
Гістограма з рівномірним та неоднорідним бункерами
Це питання описує основну різницю між рівномірною та неоднорідною гістограмою. І в цьому питанні обговорюється велике правило для вибору кількості бункерів рівномірної гістограми, яка оптимізує (в деякому сенсі) ступінь, до якого гістограма являє собою розподіл, з якого були взяті зразки даних. Я не можу знайти одне і те ж «обговорення …

2
Впливовий залишковий та інший
По-перше, я повинен зазначити, що шукав відповідь на цьому сайті. Я або не знайшов запитання, яке відповіло на моє запитання, або мій рівень знань такий низький, що я не зрозумів, що вже прочитав відповідь. Я навчаюсь на іспиті зі статистики AP. Мені доводиться вивчати лінійну регресію, і одна з тем …

4
Виявлення в Інтернеті
Я хочу обробити автоматично сегментовані мікроскопічні зображення для виявлення несправних зображень та / або несправних сегментацій у складі високопропускної трубопровідної обробки зображень. Існує безліч параметрів, які можна обчислити для кожного неочищеного зображення та сегментації, і вони стають "крайніми", коли зображення несправне. Наприклад, бульбашка на зображенні призведе до таких аномалій, як …
10 outliers  online 

1
Різниця між Outlier та Inlier
Я натрапив на термін inlier в мірі LOF (Local Outlier Factor), я знайомий з терміном "outliers" (в основному, laers - екземпляри, які не поводяться як решта екземплярів). Що означає "Inliers" у контексті виявлення аномалії? і як це пов’язано з (відмінними від) пережилими?

2
Як інтерпретувати та робити прогнозування за допомогою пакету tsoutliers та auto.arima
У мене є щомісячні дані з 1993 по 2015 рік і я б хотів зробити прогнозування цих даних. Я використовував пакет tsoutliers для виявлення людей, що втратили життя, але я не знаю, як продовжувати прогнозувати свій набір даних. Це мій код: product.outlier<-tso(product,types=c("AO","LS","TC")) plot(product.outlier) Це мій вихід із пакета tsoutliers ARIMA(0,1,0)(0,0,1)[12] …

2
Зворотне тестування або перехресне підтвердження, коли процес побудови моделі був інтерактивним
У мене є кілька прогнозних моделей, продуктивність яких я хотів би зробити тест зворотним (тобто взяти мій набір даних, "перемотати" його до попереднього моменту часу і побачити, як модель могла б працювати в перспективі). Проблема полягає в тому, що деякі мої моделі були побудовані за допомогою інтерактивного процесу. Наприклад, слідуючи …

2
Зрізане середнє проти серединного
У мене є набір даних із усіма дзвінками до служби швидкої допомоги та часом реагування відділення швидкої допомоги. Вони визнали, що є деякі помилки з часом відгуку, оскільки є випадки, коли вони не починали запис (тому значення дорівнює 0) або коли вони не зупиняли годинник (тому значення може бути надзвичайно …

6
Як підготувати / побудувати функції для виявлення аномалії (дані безпеки мережі)
Моя мета - проаналізувати мережеві журнали (наприклад, Apache, syslog, аудит безпеки Active Directory тощо), використовуючи кластеризацію / виявлення аномалії для виявлення вторгнень. З журналів у мене є багато текстових полів, таких як IP-адреса, ім’я користувача, ім’я хоста, порт призначення, порт джерела тощо (загалом 15-20 полів). Я не знаю, чи є …

1
Вибір k-значення для аналізу виявлення локального фактора (LOF)
У мене є набір тривимірних даних, і я намагаюся використовувати аналіз локального фактора Outlier, щоб визначити найбільш унікальні або дивні значення. Як можна вирішити k-значення, яке потрібно використовувати в аналізі LOF? Я розумію, що визначає значення k, і тому я не здивований, що я бачу дещо інші результати за допомогою …

2
Видалення інших людей із даних - максимальна кількість людей, які ви можете видалити?
У моїх даних є кілька людей, що хотіли, і я хотів виключити їх, щоб побачити, чи це змінить результати. На вашу думку, якою є максимальна кількість людей, які не мають права на людину? Дякую!
9 outliers 

1
Значення відсікання відстані Кука
Я читав на відстані кухаря, щоб визначити людей, які сильно впливають на мою регресію. У первісному дослідженні Кука він говорить, що коефіцієнт скорочення 1 повинен бути порівнянним для визначення впливових факторів. Однак у різних інших дослідженнях використовується або як скорочення.4н4н\frac{4}{n}4n - k - 14н-к-1\frac{4}{n-k-1} У моєму дослідженні жоден із моїх …

4
Як підігнати модель для часового ряду, що містить видатки
Я встановив модель ARIMA (5,1,2), використовуючи auto.arima()функцію R, і, шукаючи порядок, можна сказати, що це не найкраща модель для прогнозування. Якщо в ряді даних існують інші люди, який спосіб пристосувати модель до таких даних?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.