Запитання з тегом «modeling»

Цей тег описує процес створення статистичної або машинної моделі навчання. Завжди додайте більш конкретний тег.

9
Чи ми перебільшуємо важливість припущення та оцінки моделі в епоху, коли аналізи часто проводяться мирянами
Підсумок , чим більше я дізнаюся про статистику, тим менше я довіряю опублікованим статтям у своїй галузі; Я просто вважаю, що дослідники недостатньо добре займаються статистикою. Я мирянин, так би мовити. Я навчаюсь з біології, але не маю офіційної освіти зі статистики чи математики. Мені подобається R і часто докладаю …

5
Розуміння регресій - роль моделі
Як може бути корисна модель регресії, якщо ви не знаєте функції, для якої намагаєтеся отримати параметри? Я побачив фрагмент дослідження, в якому говорилося, що матері, які годували грудьми своїх дітей, рідше хворіють на діабет у подальшому житті. Дослідження було проведене під час опитування близько 1000 матерів і було контрольовано на …

8
Чи всі моделі марні? Чи можлива якась точна модель - чи корисна?
Це питання гнається в моїй свідомості вже більше місяця. Випуск Amstat News за лютий 2015 року містить статтю професора Берклі Марка ван дер Лаана, яка лаять людей за використання неточних моделей. Він заявляє, що, використовуючи моделі, статистика - це мистецтво, а не наука. За його словами, завжди можна використовувати "точну …

4
Статистичні моделі шпаргалки
Мені було цікаво, чи існує статистична модель "шпаргалки", яка містить будь-яку або більше інформації: коли використовувати модель коли не використовувати модель необхідні та необов'язкові входи очікувані результати чи була протестована модель у різних сферах (політика, біо, інженерія, виробництво тощо)? це прийнято на практиці чи дослідженнях? очікувана варіація / точність / …

2
Розуміння параметрів усередині негативного біноміального розподілу
Я намагався відповідати моїм даними в різні моделі і з'ясував , що fitdistrфункція з бібліотеки MASSз Rдає мені , Negative Binomialяк найбільш підходяще. Тепер на сторінці wiki визначення задано як: Розподіл NegBin (r, p) описує ймовірність k провалів і r успіхів у k + r випробуваннях Бернуллі (p) з успіхом …

5
Які найкращі практики виявлення ефектів взаємодії?
Окрім буквального тестування кожної можливої ​​комбінації змінних (змінних) у моделі ( x1:x2або x1*x2 ... xn-1 * xn). Як визначити, чи існує взаємодія ДОЛЖНА чи ЗНАЧАЄМО між вашими незалежними (сподіваємось) змінними? Які найкращі практики виявити взаємодію? Чи є графічна техніка, яку ви могли б або могли використати?

7
Вибір змінних для включення в модель множинної лінійної регресії
В даний час я працюю над створенням моделі з використанням множинної лінійної регресії. Після познайомлення зі своєю моделлю я не знаю, як найкраще визначити, які змінні зберігати, а які видалити. Моя модель розпочалася з 10 прогнозів для DV. При використанні всіх 10 предикторів чотири вважалися значущими. Якщо я видалю лише …

3
Як підігнати модель ARIMAX з R?
У мене є чотири різні часові ряди погодинних вимірювань: Витрата тепла всередині будинку Температура поза домом Сонячне випромінювання Швидкість вітру Я хочу мати можливість передбачити споживання тепла всередині будинку. Існує чітка сезонна тенденція, як щорічно, так і щоденно. Оскільки між різними серіями існує чітка кореляція, я хочу їх встановити за …

1
Негативне запитання про біноміальну регресію - це погана модель?
Я читаю дуже цікаву статтю Продавців та Шмуелі про регресійні моделі для підрахунку даних. Близько початку (стор. 944) вони цитують МакКаллау та Нелдера (1989), які стверджують, що негативна біноміальна регресія непопулярна і має проблематичну канонічну зв'язок. Я знайшов згаданий уривок, і він говорить (стор. 374 М і N) "Здається, мало …

3
Чому необхідний вибір змінних?
Загальні процедури вибору змінних на основі даних (наприклад, вперед, назад, поетапно, всі підмножини), як правило, дають моделі з небажаними властивостями, включаючи: Коефіцієнти відхиляються від нуля. Стандартні помилки, які занадто малі, і довірчі інтервали, які занадто вузькі. Статистика тестів та p-значень, які не мають рекламованого значення. Оцінки відповідності моделі, які надмірно …

2
Яка статистична модель за алгоритмом SVM?
Я дізнався, що при роботі з даними, використовуючи підхід, заснований на моделі, першим кроком є ​​моделювання процедури даних як статистичної моделі. Потім наступним кроком є ​​розробка ефективного / швидкого алгоритму виведення / навчання на основі цієї статистичної моделі. Тож я хочу запитати, яка статистична модель стоїть за алгоритмом векторної машини …

5
Різниця між байєсівськими мережами та процесом Маркова?
Чим відрізняється Байєсова мережа від процесу Маркова? Я вважав, що розумію принципи обох, але тепер, коли мені потрібно порівняти два, я відчуваю себе втраченим. Вони означають для мене майже те саме. Звичайно, це не так. Також вдячні посилання на інші ресурси.

1
Обчислювальна повторюваність ефектів від lmer-моделі
Я щойно натрапив на цю статтю , в якій описано, як обчислити повторюваність (він же - надійність, також внутрішньокласова кореляція) вимірювання за допомогою моделювання змішаних ефектів. R-код буде: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 


6
Як вибрати між ROC AUC та F1 балом?
Нещодавно я завершив змагання з Kaggle, в якому оцінку roc auc використовували згідно вимог змагань. Перед цим проектом я зазвичай використовував показник f1 як показник для вимірювання продуктивності моделі. Ідучи вперед, мені цікаво, як мені вибрати між цими двома показниками? Коли використовувати які та які їх плюси і мінуси? До …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.