Запитання з тегом «modeling»

Цей тег описує процес створення статистичної або машинної моделі навчання. Завжди додайте більш конкретний тег.

2
Зворотне тестування або перехресне підтвердження, коли процес побудови моделі був інтерактивним
У мене є кілька прогнозних моделей, продуктивність яких я хотів би зробити тест зворотним (тобто взяти мій набір даних, "перемотати" його до попереднього моменту часу і побачити, як модель могла б працювати в перспективі). Проблема полягає в тому, що деякі мої моделі були побудовані за допомогою інтерактивного процесу. Наприклад, слідуючи …

5
Логістична регресія на великих даних
У мене набір даних близько 5000 функцій. Для цих даних я вперше використав тест Chi Square для вибору особливостей; після цього я отримав близько 1500 змінних, які показали залежність значущості від змінної відповіді. Тепер мені потрібно підходити до цього логістичної регресії. Я використовую пакунок glmulti для R (пакет glmulti забезпечує …

4
Моделювання футбольних результатів
У Dixon, Coles ( 1997 ), вони використали максимальну оцінку ймовірності для двох модифікованих незалежних моделей Пуассона в (4.3) для моделювання балів у футболі. Я намагаюся використовувати R для того, щоб "відтворити" альфа та бета, а також параметри домашнього ефекту (стор. 274, таблиця 4), не використовуючи жодних пакетів (також використовуються …

3
Яку модель можна використовувати, коли припущення про постійну дисперсію порушено?
Оскільки ми не можемо підходити до моделі ARIMA, коли припущення про постійну дисперсію порушується, яку модель можна використовувати для пристосування одновимірних часових рядів?

2
Як моделювати суму випадкових змінних Бернуллі для залежних даних?
У мене є майже такі самі питання, як це: Як я можу ефективно моделювати суму випадкових змінних Бернуллі? Але налаштування зовсім інші: S=∑i=1,NXiS=∑i=1,NXiS=\sum_{i=1,N}{X_i} , , ~ 20, ~ 0,1P(Xi=1)=piP(Xi=1)=piP(X_{i}=1)=p_iNNNpipip_i У нас є дані для результатів випадкових змінних Бернуллі: ,Xi,jXi,jX_{i,j}Sj=∑i=1,NXi,jSj=∑i=1,NXi,jS_j=\sum_{i=1,N}{X_{i,j}} Якщо ми оцінимо з максимальною оцінкою ймовірності (і отримаємо ), вийде, …

1
Чи потрібно повторно переміщувати дані?
У нас є безліч біологічних зразків, які було досить дорого отримати. Ми ставимо ці зразки через серію тестів для отримання даних, які використовуються для побудови прогнозної моделі. Для цього ми розділили зразки на навчальні (70%) та тестові (30%) набори. Ми успішно створили модель і застосували її на тестовому наборі, щоб …

2
Обчисліть криву ROC для даних
Отже, у мене є 16 випробувань, в яких я намагаюся ідентифікувати людину з біометричної ознаки за допомогою дистанції Hamming. Мій поріг встановлено на 3,5. Мої дані нижче, і лише пробна версія 1 - справжнє Позитивне: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

10
Як ви малюєте моделі структурних рівнянь / MPLUS?
Я шукаю програмний інструмент (бажано з відкритим кодом), щоб скласти моделі структурних рівнянь / сумішей ефективно та влучно. Переглянувши xfig та graphviz, я тепер дотримуюся загального пакету векторної графіки inkscape, оскільки він здається найбільш гнучким. Я хотів би опитати спільноту stat.stackexchange: як ви малюєте свої структурні рівняння / моделі суміші? …

2
Вимірювання корисності придатності в моделі, що поєднує два розподіли
У мене є дані з подвійним піком, які я намагаюся моделювати, і між вершинами достатньо перекриття, що я не можу їх самостійно лікувати. Гістограма даних може виглядати приблизно так: Для цього я створив дві моделі: одна використовує два розподіли Пуассона, а друга використовує два негативних біноміальних розподілу (для обліку наддисперсії). …

3
Обчислення найкращого набору предикторів для лінійної регресії
Для вибору провісників в багатовимірної лінійної регресії з відповідними провісниками, які методи доступні , щоб знайти «оптимальні» підмножина предикторов без явного тестування всіх підмножин? У "Прикладному аналізі виживання" Хосмер і Лемшоу посилаються на метод Кука, але не можу знайти оригінальний документ. Чи може хтось описати цей метод чи, ще краще, …

4
Розрахунок співвідношення вибіркових даних, що використовуються для підгонки / навчання та перевірки моделі
За умови розміру вибірки "N", яку я планую використовувати для прогнозування даних. Які існують способи поділу даних, щоб я використовував деякі для встановлення моделі, а решту даних для перевірки моделі? Я знаю, що на це немає чорно-білої відповіді, але було б цікаво знати деякі "великі правила" або зазвичай використовувані співвідношення. …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.