Запитання з тегом «modeling»

Цей тег описує процес створення статистичної або машинної моделі навчання. Завжди додайте більш конкретний тег.


3
Перевірка асоціації для нормально розподіленого DV за напрямками незалежних змінних?
Чи є тест гіпотези про те, чи нормально розподілена залежна змінна асоціюється з напрямною розподіленою змінною? Наприклад, якщо час доби є пояснювальною змінною (а припустимо, що такі речі, як день тижня, місяць року тощо, не мають значення), - це як врахувати той факт, що 11 вечора на 22 години випереджає …

1
Пристосований розподіл до просторових даних
Перехресно розміщуючи моє запитання від mathoverflow, щоб знайти конкретну допомогу щодо статистики. Я вивчаю фізичний процес, генеруючи дані, які чітко проектуються у два виміри з негативними значеннями. Кожен процес має (проектовану) доріжку з - точок - див. Зображення нижче.xxxyyy Зразки доріжок синього кольору, клопіткий тип доріжки був намальований зеленим кольором, …

1
Як я можу включити інноваційний зовнішній вигляд під спостереження 48 у свою модель ARIMA?
Я працюю над набором даних. Після використання деяких методів ідентифікації моделі я вийшов із моделлю ARIMA (0,2,1). Я використав detectIOфункцію в пакеті TSAв R, щоб виявити інноваційний зовнішній вигляд (IO) під час 48-го спостереження за моїм оригінальним набором даних. Як я включу цей зовнішній вигляд у свою модель, щоб я …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

2
Придатна модель для двох нормальних розподілів в PyMC
Оскільки я інженер програмного забезпечення, який намагається дізнатися більше статистики, вам доведеться пробачити мене ще до того, як я навіть розпочну, це серйозна територія нового походження ... Я вивчав PyMC і працюю через кілька справді (дійсно) простих прикладів. Одна з проблем, яку я не можу взяти на роботу (і не …
10 modeling  python  pymc 

1
Чи регресії з помилками студента-т марні?
Перегляньте редагування. Коли у вас є дані з важкими хвостами, регресія з помилками студента-т здається інтуїтивно зрозумілою справою. Досліджуючи цю можливість, я наткнувся на цей документ: Breusch, TS, Robertson, JC, & Welsh, AH (01 листопада 1997). Новий одяг імператора: критика багатоваріантної регресійної моделі. Statistica Neerlandica, 51, 3.) ( посилання , …

1
Довідка з моделювання SEM (OpenMx, polycor)
У мене багато проблем з одним набором даних, до якого я намагаюся застосувати SEM. Ми припускаємо існування 5 прихованих факторів A, B, C, D, E з показниками, відповідно. Від А1 до А5 (упорядковані фактори), від B1 до B3 (кількісні), C1, D1, E1 (всі три останні впорядковані фактори, лише 2 рівня …

1
Чи існує поняття «достатньо» даних для навчання статистичних моделей?
Я працюю над досить великим статистичним моделюванням, наприклад, прихованими моделями Маркова та моделями суміші Гаусса. Я бачу, що для підготовки гарних моделей у кожному з цих випадків потрібен великий (> 20000 пропозицій для HMM) даних, які беруться з подібних середовищ, як остаточне використання. Моє запитання: Чи існує в літературі поняття …

5
Чи є логістична регресія упередженою, коли змінна результат розбивається на 5% - 95%?
Я будую модель схильності, використовуючи логістичну регресію для утилітного клієнта. Мене хвилює те, що із загальної вибірки моїх «поганих» рахунків лише 5%, а решта - всі хороші. Я передбачу «поганий». Чи буде результат упередженим? Що є оптимальним "погана до хорошої пропорції", щоб створити хорошу модель?

4
Поради та рекомендації для початку статистичного моделювання?
Я працюю в галузі видобутку даних і мало офіційне навчання статистики. Останнім часом я читав багато робіт, присвячених байєсівським парадигмам для вивчення та видобутку, які мені здаються дуже цікавими. Моє запитання: (у кількох частинах), враховуючи проблему, чи існує загальна рамка, за якою можна побудувати статистичну модель? Які перші дії ви …

1
Яка ймовірність цього процесу?
Хворий приймається до лікарні. Тривалість їхнього перебування залежить від двох речей: тяжкості їхніх травм та того, скільки їх страхування готові заплатити, щоб утримати їх у лікарні. Деякі пацієнти залишають передчасно, якщо їх страхування вирішить припинити оплату за перебування. Припустимо наступне: 1) Тривалість перебування розподіляється пуассоном (просто припустимо, що це зараз, …


2
Статистичні умовиводи при неправильній специфікації моделі
У мене є загальне методологічне запитання. На це можна було відповісти і раніше, але я не в змозі знайти відповідну тему. Я буду вдячний вказівниками на можливі дублікати. ( Ось чудовий, але без відповіді. Це також схоже за духом, навіть з відповіддю, але остання занадто специфічна з моєї точки зору. …

2
Моделювання крикетів для вигулу крикетів, що витягують летючих мит
У мене є набір даних, в якому детально описується велика кількість ігор з крикетом (кілька тисяч). У крикет "котелки" кілька разів кидають м'яч підряд "летючі миші". Купальник намагається витягнути летючого митця "назовні". У цьому відношенні він досить схожий на глечики та клярі в бейсболі. Якби я взяв цілий набір даних …

5
Який хороший спосіб графічного представлення дуже великої кількості парних точок даних?
У моєму полі звичайний спосіб побудувати парні дані - це серія тонких похилих відрізків ліній, перекриваючи їх медіаною та CI медіани для двох груп: Однак подібний сюжет стає набагато складнішим для читання, оскільки кількість точок даних стає дуже великою (у моєму випадку я маю порядку 10000 пар): Скорочення альфа трохи …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.