Статистика та великі дані definition

3

Я дуже мало знаю про ймовірність та статистику, і бажаю вчитися. Я бачу, що слово "розповсюдження" вживається в усьому світі в різних контекстах. Наприклад, дискретна випадкова величина має "розподіл ймовірності". Я знаю, що це таке. Неперервна випадкова величина має функцію густини ймовірності, тоді для x∈Rx∈Rx\in\mathbb{R} інтеграл від −∞−∞-\infty до xxx …

16 distributions definition

4

Точність машини для підвищення градієнта зменшується зі збільшенням кількості ітерацій

Я експериментую з алгоритмом машини для підвищення градієнта через caretпакет в Р. Використовуючи невеликий набір даних про вступ до коледжу, я застосував такий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

5

Різниця між термінами "спільний розподіл" та "багатоваріантний розподіл"?

Я пишу про використання "спільного розподілу ймовірностей" для аудиторії, яка з більшою ймовірністю зрозуміє "багатоваріантний розподіл", тому я розглядаю можливість використання пізніше. Однак я не хочу втрачати сенс, роблячи це. Вікіпедія, схоже, вказує, що це синоніми. Чи вони? Якщо ні, то чому б і ні?

15 probability terminology joint-distribution definition

1

Яке точне визначення "справи Хейвуда"?

Я використовував термін "кейс Хейвуд" дещо неофіційно для позначення ситуацій, коли в Інтернеті, "обмежена відповідь", ітеративно оновлена оцінка дисперсії стала негативною через числові проблеми з точністю. (Я використовую варіант методу Велфорда для додавання даних та видалення старих даних.) Я мав враження, що він застосовується до будь-якої ситуації, коли оцінка дисперсії …

15 variance factor-analysis definition online

2

Приклади статистики, яка не залежить від розподілу вибірки?

Це визначення статистики у wikipedia Більш формально, статистична теорія визначає статистику як функцію вибірки, де сама функція не залежить від розподілу вибірки; тобто функцію можна заявити перед реалізацією даних. Термін статистика використовується як для функції, так і для значення функції на даному вибірці. Я думаю, що я розумію більшість цього …

14 mathematical-statistics definition

1

Як "Основна теорія факторного аналізу" застосовується до PCA, або як визначаються навантаження PCA?

Зараз я переживаю слайд, який я маю для "факторного аналізу" (PCA, наскільки я можу сказати). У ній виведена "фундаментальна теорема факторного аналізу", яка стверджує, що матрицю кореляції даних, що надходять в аналіз ( ), можна відновити за допомогою матриці факторних навантажень ( A ):RR\bf RAA\bf A R = A A⊤R=AA⊤\bf …

14 pca factor-analysis terminology definition

1

Confounder - визначення

Як стверджує М. Кац у своїй книзі « Багатовимірний аналіз» (Розділ 1.2, сторінка 6), « Конфідент асоціюється з фактором ризику і причинно пов’язаний з результатом. » Чому учасник повинен бути причинно пов'язаний з результатом? Чи буде достатньо для того, щоб доповідач був пов'язаний з результатом?

14 causality definition confounding

2

Ви відкидаєте нульову гіпотезу, коли

Це, очевидно, лише питання визначення чи конвенції і майже не має практичного значення. Якщо для встановлено його традиційне значення 0,05, чи р значення 0,0500000000000 ... вважається статистично значущим чи ні? Чи правило для визначення статистичної значущості зазвичай вважається p < α або p ≤ α ??αα\alphapppp<αp<αp < \alphap≤αp≤αp \leq \alpha

14 hypothesis-testing statistical-significance definition

6

Чим відрізняється ефективність та ефективність у визначенні переваги терапії «А» за умови «В»?

Контекст цього питання знаходиться в межах здоров'я, тобто розглядає одну або кілька методів терапії при лікуванні стану. Схоже, навіть шановані дослідники плутають терміни ефективність та ефективність , використовуючи терміни взаємозамінно. Як можна думати про ефективність та ефективність таким чином, що може допомогти зняти плутанину? Який тип проектів дослідження був би …

14 epidemiology causality clinical-trials definition instrumental-variables

2

чи (x) значення оператора?

Я бачив оператор скрізь у деякому огляді літератури, який я роблю з причинності (див., Наприклад, цей запис у Вікіпедії ). Однак я не можу знайти формальне та загальне визначення цього оператора.гo ( x )do(x)do(x) Чи може хтось вказати мені на гарну довідку щодо цього? Мене цікавить загальне визначення, а не …

14 references causality definition

2

Що таке проба Томпсона з точки зору мирян?

Я не в змозі зрозуміти вибірку Томпсона і як це працює. Я читав про Multi Arm Bandit і після читання алгоритму, пов'язаного з верхнім довір'ям, багато текстів наводив на думку про те, що вибірки Томпсона працюють краще, ніж UCB. Що таке проба Томпсона, простіше кажучи? Сміливо надайте довідкові статті для …

14 machine-learning definition multiarmed-bandit

2

Що означає «інваріант перестановки» у контексті нейронних мереж, що розпізнають зображення?

Я бачив термін "інваріант перестановки" завдання завдання розпізнавання знаків MNIST. Що це означає?

14 machine-learning neural-networks terminology conv-neural-network definition

3

Визначення та розмежування регресійної моделі

Збентежуюче просте запитання - але, схоже, його раніше не було поставлено на перехресну перевірку: Що таке визначення регресійної моделі? Також питання підтримки, Що не є регресійною моделлю? Що стосується останнього, мене цікавлять хитрі приклади, коли відповідь не відразу очевидна, наприклад, ARIMA або GARCH.

13 regression linear-model model terminology definition

2

Що таке закономірності та регуляризація?

Ці слова я все більше і більше чую, коли вивчаю машинне навчання. Насправді деякі люди виграли медаль Філдса, працюючи над закономірностями рівнянь. Отже, я думаю, що це термін, який переносить себе від статистичної фізики / математики до машинного навчання. Звичайно, кількість людей, яких я запитувала, просто не могла інтуїтивно пояснити …

12 machine-learning self-study terminology regularization definition

5

Як виконати імпутацію значень у дуже великій кількості точок даних?

У мене дуже великий набір даних, і близько 5% випадкових значень відсутні. Ці змінні співвідносяться між собою. Наступний приклад набору даних R - це лише іграшковий приклад з манекено-корельованими даними. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

Запитання з тегом «definition»