Статистика та великі дані modeling

3

Коли я не можу замінити випадкову змінну її середньою?

Часте спрощення моделювання та моделювання полягає в заміні випадкової величини на її середнє значення. Коли це спрощення призведе до неправильного висновку?

10 modeling mean random-variable

3

Перевірка асоціації для нормально розподіленого DV за напрямками незалежних змінних?

Чи є тест гіпотези про те, чи нормально розподілена залежна змінна асоціюється з напрямною розподіленою змінною? Наприклад, якщо час доби є пояснювальною змінною (а припустимо, що такі речі, як день тижня, місяць року тощо, не мають значення), - це як врахувати той факт, що 11 вечора на 22 години випереджає …

10 hypothesis-testing modeling circular-statistics

1

Пристосований розподіл до просторових даних

Перехресно розміщуючи моє запитання від mathoverflow, щоб знайти конкретну допомогу щодо статистики. Я вивчаю фізичний процес, генеруючи дані, які чітко проектуються у два виміри з негативними значеннями. Кожен процес має (проектовану) доріжку з - точок - див. Зображення нижче.xxxyyy Зразки доріжок синього кольору, клопіткий тип доріжки був намальований зеленим кольором, …

10 distributions modeling predictive-models fitting curve-fitting

1

Як я можу включити інноваційний зовнішній вигляд під спостереження 48 у свою модель ARIMA?

Я працюю над набором даних. Після використання деяких методів ідентифікації моделі я вийшов із моделлю ARIMA (0,2,1). Я використав detectIOфункцію в пакеті TSAв R, щоб виявити інноваційний зовнішній вигляд (IO) під час 48-го спостереження за моїм оригінальним набором даних. Як я включу цей зовнішній вигляд у свою модель, щоб я …

10 r time-series arima outliers hypergeometric fishers-exact r time-series intraclass-correlation r logistic glmm clogit mixed-model spss repeated-measures ancova machine-learning python scikit-learn distributions data-transformation stochastic-processes web standard-deviation r machine-learning spatial similarities spatio-temporal binomial sparse poisson-process r regression nonparametric r regression logistic simulation power-analysis r svm random-forest anova repeated-measures manova regression statistical-significance cross-validation group-differences model-comparison r spatial model-evaluation parallel-computing generalized-least-squares r stata fitting mixture hypothesis-testing categorical-data hypothesis-testing anova statistical-significance repeated-measures likert wilcoxon-mann-whitney boxplot statistical-significance confidence-interval forecasting prediction-interval regression categorical-data stata least-squares experiment-design skewness reliability cronbachs-alpha r regression splines maximum-likelihood modeling likelihood-ratio profile-likelihood nested-models

2

Придатна модель для двох нормальних розподілів в PyMC

Оскільки я інженер програмного забезпечення, який намагається дізнатися більше статистики, вам доведеться пробачити мене ще до того, як я навіть розпочну, це серйозна територія нового походження ... Я вивчав PyMC і працюю через кілька справді (дійсно) простих прикладів. Одна з проблем, яку я не можу взяти на роботу (і не …

10 modeling python pymc

1

Чи регресії з помилками студента-т марні?

Перегляньте редагування. Коли у вас є дані з важкими хвостами, регресія з помилками студента-т здається інтуїтивно зрозумілою справою. Досліджуючи цю можливість, я наткнувся на цей документ: Breusch, TS, Robertson, JC, & Welsh, AH (01 листопада 1997). Новий одяг імператора: критика багатоваріантної регресійної моделі. Statistica Neerlandica, 51, 3.) ( посилання , …

10 regression mathematical-statistics modeling robust

1

Довідка з моделювання SEM (OpenMx, polycor)

У мене багато проблем з одним набором даних, до якого я намагаюся застосувати SEM. Ми припускаємо існування 5 прихованих факторів A, B, C, D, E з показниками, відповідно. Від А1 до А5 (упорядковані фактори), від B1 до B3 (кількісні), C1, D1, E1 (всі три останні впорядковані фактори, лише 2 рівня …

10 r modeling multiple-regression sem

1

Чи існує поняття «достатньо» даних для навчання статистичних моделей?

Я працюю над досить великим статистичним моделюванням, наприклад, прихованими моделями Маркова та моделями суміші Гаусса. Я бачу, що для підготовки гарних моделей у кожному з цих випадків потрібен великий (> 20000 пропозицій для HMM) даних, які беруться з подібних середовищ, як остаточне використання. Моє запитання: Чи існує в літературі поняття …

10 modeling hidden-markov-model gaussian-mixture

5

Чи є логістична регресія упередженою, коли змінна результат розбивається на 5% - 95%?

Я будую модель схильності, використовуючи логістичну регресію для утилітного клієнта. Мене хвилює те, що із загальної вибірки моїх «поганих» рахунків лише 5%, а решта - всі хороші. Я передбачу «поганий». Чи буде результат упередженим? Що є оптимальним "погана до хорошої пропорції", щоб створити хорошу модель?

10 logistic modeling

4

Я працюю в галузі видобутку даних і мало офіційне навчання статистики. Останнім часом я читав багато робіт, присвячених байєсівським парадигмам для вивчення та видобутку, які мені здаються дуже цікавими. Моє запитання: (у кількох частинах), враховуючи проблему, чи існує загальна рамка, за якою можна побудувати статистичну модель? Які перші дії ви …

10 bayesian modeling references eda

1

Яка ймовірність цього процесу?

Хворий приймається до лікарні. Тривалість їхнього перебування залежить від двох речей: тяжкості їхніх травм та того, скільки їх страхування готові заплатити, щоб утримати їх у лікарні. Деякі пацієнти залишають передчасно, якщо їх страхування вирішить припинити оплату за перебування. Припустимо наступне: 1) Тривалість перебування розподіляється пуассоном (просто припустимо, що це зараз, …

10 maximum-likelihood modeling

9

Інструменти для моделювання фінансових часових рядів

Які сучасні інструменти (на базі Windows) ви пропонуєте для моделювання фінансових часових рядів?

10 modeling time-series finance software

2

Статистичні умовиводи при неправильній специфікації моделі

У мене є загальне методологічне запитання. На це можна було відповісти і раніше, але я не в змозі знайти відповідну тему. Я буду вдячний вказівниками на можливі дублікати. ( Ось чудовий, але без відповіді. Це також схоже за духом, навіть з відповіддю, але остання занадто специфічна з моєї точки зору. …

9 modeling inference misspecification

2

Моделювання крикетів для вигулу крикетів, що витягують летючих мит

У мене є набір даних, в якому детально описується велика кількість ігор з крикетом (кілька тисяч). У крикет "котелки" кілька разів кидають м'яч підряд "летючі миші". Купальник намагається витягнути летючого митця "назовні". У цьому відношенні він досить схожий на глечики та клярі в бейсболі. Якби я взяв цілий набір даних …

9 probability modeling games

5

Який хороший спосіб графічного представлення дуже великої кількості парних точок даних?

У моєму полі звичайний спосіб побудувати парні дані - це серія тонких похилих відрізків ліній, перекриваючи їх медіаною та CI медіани для двох груп: Однак подібний сюжет стає набагато складнішим для читання, оскільки кількість точок даних стає дуже великою (у моєму випадку я маю порядку 10000 пар): Скорочення альфа трохи …

9 generalized-linear-model data-visualization modeling interpretation paired-data

Запитання з тегом «modeling»