Запитання з тегом «sample»

Вибірка - це підмножина популяції. Статистика, як правило, стосується використання вибірок для висновку про параметри, що регулюють більшу (можливо, нескінченну) сукупність.

4
Як взяти багато зразків з 10 з великого списку, без загальної заміни
У мене є великий набір даних (20 000 точок даних), з яких я хочу взяти повторні зразки з 10 точок даних. Однак, як тільки я вибрав ці 10 точок даних, я хочу, щоб вони більше не вибиралися. Я намагався використовувати цю sampleфункцію, але, схоже, не існує можливості вибірки без заміни …
12 r  sample 

1
Оцініть дисперсію сукупності, якщо середня кількість населення відома
Я знаю, що ми використовуємо для оцінки дисперсії популяції. Я пам’ятаю відео з Академії Хана, де інтуїція полягала в тому, що наша передбачувана середня величина, ймовірно, трохи перевищує фактичну, тому відстані насправді будуть більшими, тому ми ділимо на менше ( замість ) щоб отримати більшу цінність, в результаті чого можна …
11 variance  sample 

5
Якщо не Пуассон, то який розподіл це?
У мене є набір даних, що містить кількість дій, здійснених особами протягом 7 днів. Конкретна дія не повинна відповідати цьому питанню. Ось деякі описові статистичні дані для набору даних: ДальністьСереднійВаріантністьКількість спостережень0 - 77218.22791 рік696Дальність0-772Середній18.2Варіантність2791 рікКількість спостережень696 \begin{array}{|c|c|} \hline \text{Range} & 0 - 772 \\ \hline \text{Mean} & 18.2 \\ \hline …

1
Чи SurveyMonkey ігнорує той факт, що ви отримуєте невипадкову вибірку?
SurveyMonkey має кроки та діаграму, щоб визначити, який розмір вибірки потрібен для заданого інтервалу помилок або довірчого інтервалу, виходячи з чисельності вашого населення. Розмір вибірки SurveyMonkey Чи просто ігнорує цей графік той факт, що ви не отримаєте випадкову вибірку, оскільки ви отримуєте лише людей, які турбуються відповісти на опитування? Коли …

1
Чому вибіркова частка також не має біноміального розподілу
У двочленних умовах випадкова величина X, яка дає кількість успіхів, розподілена біноміально. Частка вибірки може бути обчислена як де - ваш розмір вибірки. Мій підручник говорить про цеXнXн\frac{X}{n}ннn Ця частка не має біноміального розподілу однак, оскільки є просто масштабованою версією біноміально розподіленої випадкової величини , чи не має вона також …

2
Оцінка розміру перетину декількох множин за допомогою вибірки одного набору
Я працюю над алгоритмом, який повинен обчислити розмір набору, генерованого перетинами щонайменше 2 множин. Більш конкретно: z=|A0∩…∩An|z=|A0∩…∩An| z = \left |A_0 \cap \ldots \cap A_n \right | Набори, які перетинаються, генеруються за допомогою SQL-запитів, і, прагнучи швидко тримати речі, я отримую підрахунок кожного запиту достроково, потім беру набір з найменшим …
10 error  sample 

1
R лінійна регресія, категоріальна змінна значення «приховане»
Це лише приклад, на який я зустрічався кілька разів, тому у мене немає даних про вибірку. Запуск лінійної регресійної моделі в R: a.lm = lm(Y ~ x1 + x2) x1є суцільною змінною. x2категоричний і має три значення, наприклад "Низький", "Середній" та "Високий". Однак вихід, отриманий R, був би на кшталт: …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
Як визначити, що таке «зразок»?
Якщо я даю вам три числа, які незалежно і однаково виведені зі стандартного нормального розподілу, то я дав вам три зразки або один зразок? Якщо відповідь - один зразок, то чи є коротке ім’я того, що я дав вам три?

2
Обчисліть криву ROC для даних
Отже, у мене є 16 випробувань, в яких я намагаюся ідентифікувати людину з біометричної ознаки за допомогою дистанції Hamming. Мій поріг встановлено на 3,5. Мої дані нижче, і лише пробна версія 1 - справжнє Позитивне: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

4
Розрахунок співвідношення вибіркових даних, що використовуються для підгонки / навчання та перевірки моделі
За умови розміру вибірки "N", яку я планую використовувати для прогнозування даних. Які існують способи поділу даних, щоб я використовував деякі для встановлення моделі, а решту даних для перевірки моделі? Я знаю, що на це немає чорно-білої відповіді, але було б цікаво знати деякі "великі правила" або зазвичай використовувані співвідношення. …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.