Запитання з тегом «mean»

Очікуване значення випадкової величини; або місцеположення для вибірки.

2
Чи існує зразковий варіант однобічної нерівності Чебишева?
Мене цікавить наступна однобічна версія Кантеллі про нерівність Чебишева : P(X−E(X)≥t)≤Var(X)Var(X)+t2.P(X−E(X)≥t)≤Var(X)Var(X)+t2. \mathbb P(X - \mathbb E (X) \geq t) \leq \frac{\mathrm{Var}(X)}{\mathrm{Var}(X) + t^2} \,. В основному, якщо ви знаєте середню сукупність та дисперсію, ви можете обчислити верхню межу щодо ймовірності спостереження певного значення. (Це було принаймні моє розуміння.) Однак я …

4
Які відносні переваги даних Winsorizing vs Trimming?
Вінсоризація даних означає заміщення крайніх значень набору даних певним відсотковим значенням з кожного кінця, тоді як обрізка або обрізання передбачає видалення цих крайніх значень. Я завжди бачу, як обидва методи обговорюються як життєздатний варіант зменшення ефекту випускників при обчисленні статистичних даних, таких як середнє або стандартне відхилення, але я не …

8
Заміна випускників середнім рівнем
Це питання мені задав мій друг, який не користується Інтернетом. У мене немає статистичних даних, і я шукав Інтернет з цього питання. Питання полягає в тому, чи можна замінити середньостатистичні показники? якщо це можливо, чи є довідники / журнали для резервного копіювання цього твердження?

5
Яка різниця між "середньою величиною" та "середньою"?
Вікіпедія пояснює: Для набору даних середнє значення - це сума значень, поділена на кількість значень. Однак це визначення відповідає тому, що я називаю "середнім" (принаймні, це те, що я пам'ятаю, як вчився). І все ж Вікіпедія ще раз цитує: Існують і інші статистичні заходи, які використовують зразки, які деякі люди …

4
Чи означає = режим означає симетричний розподіл?
Я знаю, що це запитання було задано із випадком середня = медіана, але я не знайшов нічого, пов’язаного зі значенням = режим. Якщо режим дорівнює середньому, чи можу я завжди зробити висновок, що це симетричний розподіл? Чи змушений я знати також медіану для цієї манери?

2
Чи існує надійний непараметричний інтервал довіри для середнього косого розподілу?
Дуже перекошені розподіли, такі як log-normal, не призводять до точних довірчих інтервалів завантаження. Ось приклад, який показує, що область лівого і правого хвостів далека від ідеальних 0,025, незалежно від того, який метод завантажувального пристрою ви намагаєтеся виконати в R: require(boot) n <- 25 B <- 1000 nsim <- 1000 set.seed(1) …

5
Як боротися з ієрархічними / вкладеними даними в машинному навчанні
Я поясню свою проблему на прикладі. Припустимо, ви хочете передбачити дохід фізичної особи за деякими ознаками: {Вік, стать, країна, регіон, місто}. У вас такий навчальний набір даних train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

10
Регресія в середньому проти помилковості гравця
З одного боку, у мене середній регрес, а з іншого - помилковість гравця . Помилковість Гамблера визначається Міллером і Санджурьо (2019) як "помилкова віра в те, що випадкові послідовності мають систематичну тенденцію до розвороту. Час підряд вважатиметься непропорційно ймовірним, що впаде хвости на наступному випробуванні. Я мав гарну результативність в …

1
Чи може ступінь свободи бути цілим числом?
Коли я використовую GAM, це дає мені залишковий коефіцієнт DF (останній рядок у коді). Що це означає? Виходячи за приклад GAM, загалом, чи може число ступенів свободи бути нецілим числом?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

3
Чим пошук центроїда відрізняється від знаходження середнього?
Виконуючи ієрархічну кластеризацію, можна використовувати багато метрик для вимірювання відстані між кластерами. Дві такі метрики передбачають обчислення центроїдів і засобів точок даних у кластерах. Яка різниця між середнім та центроїдним? Хіба це не однакова точка кластеру?
26 clustering  mean 

3
Як обчислити довірчий інтервал співвідношення двох нормальних засобів
Я хочу отримати межі для довірчого інтервалу для відношення двох засобів. Припустимо, що і X_2 \ sim N (\ theta_2, \ sigma ^ 2) незалежні, середнє відношення \ Gamma = \ theta_1 / \ theta_2 . Я намагався вирішити: \ text {Pr} (- z (\ alpha / 2)) \ leq …

3
Що можна зробити висновок про дані, коли середнє арифметичне дуже близьке до середнього геометричного?
Чи є щось значне щодо середнього геометричного та середнього арифметичного, що падають дуже близько один до одного, скажімо, ~ 0,1%? Які підказки можна зробити щодо такого набору даних? Я працював над аналізом набору даних, і зауважую, що за іронією долі значення дуже і дуже близькі. Не точно, але близько. Крім …

4
Як визначити, чи мій розподіл даних симетричний?
Я знаю, що якщо медіана і середня величина приблизно рівні, то це означає, що існує симетричне розподіл, але в цьому конкретному випадку я не впевнений. Середня та медіана досить близькі (лише 0,487 м / різниця в жовчі), що призведе до того, що я можу сказати, що існує симетричний розподіл, але …

4
Чому середня тенденція є більш стійкою у різних пробах, ніж середня?
Розділ 1.7.2 Розкриття статистики за допомогою R Енді Філдса та ін., Перераховуючи середні чесноти проти медіани, констатує: ... середнє значення має стійкість у різних зразках. Це після пояснення багатьох чеснот медіани, наприклад ... На медіану відносно не впливають екстремальні бали на будь-якому кінці розподілу ... Зважаючи на те, що на …
22 mean  median 


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.