Запитання з тегом «definition»

Цей тег вказує питання щодо визначень статистичних термінів. Використовуйте більш загальний тег [термінологію] для запитань щодо статистичної мови, які конкретно не стосуються визначень.

3
Що саме таке розподіл?
Я дуже мало знаю про ймовірність та статистику, і бажаю вчитися. Я бачу, що слово "розповсюдження" вживається в усьому світі в різних контекстах. Наприклад, дискретна випадкова величина має "розподіл ймовірності". Я знаю, що це таке. Неперервна випадкова величина має функцію густини ймовірності, тоді для x∈Rx∈Rx\in\mathbb{R} інтеграл від −∞−∞-\infty до xxx …

4
Точність машини для підвищення градієнта зменшується зі збільшенням кількості ітерацій
Я експериментую з алгоритмом машини для підвищення градієнта через caretпакет в Р. Використовуючи невеликий набір даних про вступ до коледжу, я застосував такий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

5
Різниця між термінами "спільний розподіл" та "багатоваріантний розподіл"?
Я пишу про використання "спільного розподілу ймовірностей" для аудиторії, яка з більшою ймовірністю зрозуміє "багатоваріантний розподіл", тому я розглядаю можливість використання пізніше. Однак я не хочу втрачати сенс, роблячи це. Вікіпедія, схоже, вказує, що це синоніми. Чи вони? Якщо ні, то чому б і ні?

1
Яке точне визначення "справи Хейвуда"?
Я використовував термін "кейс Хейвуд" дещо неофіційно для позначення ситуацій, коли в Інтернеті, "обмежена відповідь", ітеративно оновлена ​​оцінка дисперсії стала негативною через числові проблеми з точністю. (Я використовую варіант методу Велфорда для додавання даних та видалення старих даних.) Я мав враження, що він застосовується до будь-якої ситуації, коли оцінка дисперсії …

2
Приклади статистики, яка не залежить від розподілу вибірки?
Це визначення статистики у wikipedia Більш формально, статистична теорія визначає статистику як функцію вибірки, де сама функція не залежить від розподілу вибірки; тобто функцію можна заявити перед реалізацією даних. Термін статистика використовується як для функції, так і для значення функції на даному вибірці. Я думаю, що я розумію більшість цього …

1
Як "Основна теорія факторного аналізу" застосовується до PCA, або як визначаються навантаження PCA?
Зараз я переживаю слайд, який я маю для "факторного аналізу" (PCA, наскільки я можу сказати). У ній виведена "фундаментальна теорема факторного аналізу", яка стверджує, що матрицю кореляції даних, що надходять в аналіз ( ), можна відновити за допомогою матриці факторних навантажень ( A ):RR\bf RAA\bf A R = A A⊤R=AA⊤\bf …

1
Confounder - визначення
Як стверджує М. Кац у своїй книзі « Багатовимірний аналіз» (Розділ 1.2, сторінка 6), « Конфідент асоціюється з фактором ризику і причинно пов’язаний з результатом. » Чому учасник повинен бути причинно пов'язаний з результатом? Чи буде достатньо для того, щоб доповідач був пов'язаний з результатом?

2
Ви відкидаєте нульову гіпотезу, коли
Це, очевидно, лише питання визначення чи конвенції і майже не має практичного значення. Якщо для встановлено його традиційне значення 0,05, чи р значення 0,0500000000000 ... вважається статистично значущим чи ні? Чи правило для визначення статистичної значущості зазвичай вважається p &lt; α або p ≤ α ??αα\alphapppp&lt;αp&lt;αp < \alphap≤αp≤αp \leq \alpha

6
Чим відрізняється ефективність та ефективність у визначенні переваги терапії «А» за умови «В»?
Контекст цього питання знаходиться в межах здоров'я, тобто розглядає одну або кілька методів терапії при лікуванні стану. Схоже, навіть шановані дослідники плутають терміни ефективність та ефективність , використовуючи терміни взаємозамінно. Як можна думати про ефективність та ефективність таким чином, що може допомогти зняти плутанину? Який тип проектів дослідження був би …

2
чи (x) значення оператора?
Я бачив оператор скрізь у деякому огляді літератури, який я роблю з причинності (див., Наприклад, цей запис у Вікіпедії ). Однак я не можу знайти формальне та загальне визначення цього оператора.гo ( x )do(x)do(x) Чи може хтось вказати мені на гарну довідку щодо цього? Мене цікавить загальне визначення, а не …

2
Що таке проба Томпсона з точки зору мирян?
Я не в змозі зрозуміти вибірку Томпсона і як це працює. Я читав про Multi Arm Bandit і після читання алгоритму, пов'язаного з верхнім довір'ям, багато текстів наводив на думку про те, що вибірки Томпсона працюють краще, ніж UCB. Що таке проба Томпсона, простіше кажучи? Сміливо надайте довідкові статті для …


3
Визначення та розмежування регресійної моделі
Збентежуюче просте запитання - але, схоже, його раніше не було поставлено на перехресну перевірку: Що таке визначення регресійної моделі? Також питання підтримки, Що не є регресійною моделлю? Що стосується останнього, мене цікавлять хитрі приклади, коли відповідь не відразу очевидна, наприклад, ARIMA або GARCH.

2
Що таке закономірності та регуляризація?
Ці слова я все більше і більше чую, коли вивчаю машинне навчання. Насправді деякі люди виграли медаль Філдса, працюючи над закономірностями рівнянь. Отже, я думаю, що це термін, який переносить себе від статистичної фізики / математики до машинного навчання. Звичайно, кількість людей, яких я запитувала, просто не могла інтуїтивно пояснити …

5
Як виконати імпутацію значень у дуже великій кількості точок даних?
У мене дуже великий набір даних, і близько 5% випадкових значень відсутні. Ці змінні співвідносяться між собою. Наступний приклад набору даних R - це лише іграшковий приклад з манекено-корельованими даними. set.seed(123) # matrix of X variable xmat &lt;- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) &lt;- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.