Статистика та великі дані outliers

5

Як виправити колишніх виявлених людей для прогнозування даних часових рядів?

Я намагаюся знайти спосіб виправлення інших людей, коли я знаходжу / виявляю їх у даних часових рядів. Деякі методи, такі як nnetar в R, дають деякі помилки для часових рядів з великими / великими залишками. Мені вже вдалося виправити пропущені значення, але люди, які переживають, все ще шкодять моїм прогнозам …

10 time-series forecasting outliers winsorizing

2

Виявлення аномалії: який алгоритм використовувати?

Контекст: Я розробляю систему, яка аналізує клінічні дані, щоб відфільтрувати неправдоподібні дані, які можуть бути помилковими. Що я робив до цього часу: Для кількісної оцінки правдоподібності моєю спробою поки що була нормалізація даних, а потім обчислення значення правдоподібності для точки p на основі її відстані до відомих точок даних у …

10 machine-learning multivariate-analysis feature-selection algorithms outliers

1

Як я можу включити інноваційний зовнішній вигляд під спостереження 48 у свою модель ARIMA?

Я працюю над набором даних. Після використання деяких методів ідентифікації моделі я вийшов із моделлю ARIMA (0,2,1). Я використав detectIOфункцію в пакеті TSAв R, щоб виявити інноваційний зовнішній вигляд (IO) під час 48-го спостереження за моїм оригінальним набором даних. Як я включу цей зовнішній вигляд у свою модель, щоб я …

10 r time-series arima outliers hypergeometric fishers-exact r time-series intraclass-correlation r logistic glmm clogit mixed-model spss repeated-measures ancova machine-learning python scikit-learn distributions data-transformation stochastic-processes web standard-deviation r machine-learning spatial similarities spatio-temporal binomial sparse poisson-process r regression nonparametric r regression logistic simulation power-analysis r svm random-forest anova repeated-measures manova regression statistical-significance cross-validation group-differences model-comparison r spatial model-evaluation parallel-computing generalized-least-squares r stata fitting mixture hypothesis-testing categorical-data hypothesis-testing anova statistical-significance repeated-measures likert wilcoxon-mann-whitney boxplot statistical-significance confidence-interval forecasting prediction-interval regression categorical-data stata least-squares experiment-design skewness reliability cronbachs-alpha r regression splines maximum-likelihood modeling likelihood-ratio profile-likelihood nested-models

1

Гістограма з рівномірним та неоднорідним бункерами

Це питання описує основну різницю між рівномірною та неоднорідною гістограмою. І в цьому питанні обговорюється велике правило для вибору кількості бункерів рівномірної гістограми, яка оптимізує (в деякому сенсі) ступінь, до якого гістограма являє собою розподіл, з якого були взяті зразки даних. Я не можу знайти одне і те ж «обговорення …

10 nonparametric outliers histogram rule-of-thumb

2

Впливовий залишковий та інший

По-перше, я повинен зазначити, що шукав відповідь на цьому сайті. Я або не знайшов запитання, яке відповіло на моє запитання, або мій рівень знань такий низький, що я не зрозумів, що вже прочитав відповідь. Я навчаюсь на іспиті зі статистики AP. Мені доводиться вивчати лінійну регресію, і одна з тем …

10 regression outliers residuals

4

Виявлення в Інтернеті

Я хочу обробити автоматично сегментовані мікроскопічні зображення для виявлення несправних зображень та / або несправних сегментацій у складі високопропускної трубопровідної обробки зображень. Існує безліч параметрів, які можна обчислити для кожного неочищеного зображення та сегментації, і вони стають "крайніми", коли зображення несправне. Наприклад, бульбашка на зображенні призведе до таких аномалій, як …

10 outliers online

1

Різниця між Outlier та Inlier

Я натрапив на термін inlier в мірі LOF (Local Outlier Factor), я знайомий з терміном "outliers" (в основному, laers - екземпляри, які не поводяться як решта екземплярів). Що означає "Inliers" у контексті виявлення аномалії? і як це пов’язано з (відмінними від) пережилими?

10 residuals outliers anomaly-detection

2

Як інтерпретувати та робити прогнозування за допомогою пакету tsoutliers та auto.arima

У мене є щомісячні дані з 1993 по 2015 рік і я б хотів зробити прогнозування цих даних. Я використовував пакет tsoutliers для виявлення людей, що втратили життя, але я не знаю, як продовжувати прогнозувати свій набір даних. Це мій код: product.outlier<-tso(product,types=c("AO","LS","TC")) plot(product.outlier) Це мій вихід із пакета tsoutliers ARIMA(0,1,0)(0,0,1)[12] …

9 r time-series forecasting arima outliers

2

Зворотне тестування або перехресне підтвердження, коли процес побудови моделі був інтерактивним

У мене є кілька прогнозних моделей, продуктивність яких я хотів би зробити тест зворотним (тобто взяти мій набір даних, "перемотати" його до попереднього моменту часу і побачити, як модель могла б працювати в перспективі). Проблема полягає в тому, що деякі мої моделі були побудовані за допомогою інтерактивного процесу. Наприклад, слідуючи …

9 cross-validation modeling outliers splines overfitting

2

Зрізане середнє проти серединного

У мене є набір даних із усіма дзвінками до служби швидкої допомоги та часом реагування відділення швидкої допомоги. Вони визнали, що є деякі помилки з часом відгуку, оскільки є випадки, коли вони не починали запис (тому значення дорівнює 0) або коли вони не зупиняли годинник (тому значення може бути надзвичайно …

9 mean outliers median trimmed-mean

6

Як підготувати / побудувати функції для виявлення аномалії (дані безпеки мережі)

Моя мета - проаналізувати мережеві журнали (наприклад, Apache, syslog, аудит безпеки Active Directory тощо), використовуючи кластеризацію / виявлення аномалії для виявлення вторгнень. З журналів у мене є багато текстових полів, таких як IP-адреса, ім’я користувача, ім’я хоста, порт призначення, порт джерела тощо (загалом 15-20 полів). Я не знаю, чи є …

9 feature-selection outliers unsupervised-learning feature-construction

1

Вибір k-значення для аналізу виявлення локального фактора (LOF)

У мене є набір тривимірних даних, і я намагаюся використовувати аналіз локального фактора Outlier, щоб визначити найбільш унікальні або дивні значення. Як можна вирішити k-значення, яке потрібно використовувати в аналізі LOF? Я розумію, що визначає значення k, і тому я не здивований, що я бачу дещо інші результати за допомогою …

9 data-mining outliers

2

Видалення інших людей із даних - максимальна кількість людей, які ви можете видалити?

У моїх даних є кілька людей, що хотіли, і я хотів виключити їх, щоб побачити, чи це змінить результати. На вашу думку, якою є максимальна кількість людей, які не мають права на людину? Дякую!

9 outliers

1

Значення відсікання відстані Кука

Я читав на відстані кухаря, щоб визначити людей, які сильно впливають на мою регресію. У первісному дослідженні Кука він говорить, що коефіцієнт скорочення 1 повинен бути порівнянним для визначення впливових факторів. Однак у різних інших дослідженнях використовується або як скорочення.4н4н\frac{4}{n}4n - k - 14н-к-1\frac{4}{n-k-1} У моєму дослідженні жоден із моїх …

9 outliers cooks-distance

4

Як підігнати модель для часового ряду, що містить видатки

Я встановив модель ARIMA (5,1,2), використовуючи auto.arima()функцію R, і, шукаючи порядок, можна сказати, що це не найкраща модель для прогнозування. Якщо в ряді даних існують інші люди, який спосіб пристосувати модель до таких даних?

9 r time-series forecasting outliers arima

Запитання з тегом «outliers»