Запитання з тегом «sampling»

Створення зразків із чітко визначеної сукупності за допомогою ймовірнісного методу та / або отримання випадкових чисел із заданого розподілу. Оскільки цей тег неоднозначний, будь ласка, врахуйте [опитування-вибірка] для першого та [monte-carlo] або [моделювання] для другого. З питань, що стосуються створення випадкових зразків із відомих дистрибутивів, будь ласка, розгляньте використання тегу [випадкове покоління].

2
Як вибрати розміри навчальних, перехресних перевірок та тестових наборів для малих даних про розмір вибірки?
Припустимо, у мене невеликий розмір вибірки, наприклад N = 100, і два класи. Як я повинен вибрати розміри навчальних, перехресних перевірок та тестових наборів для машинного навчання? Я б інтуїтивно вибирав Розмір тренувального набору - 50 Перехресне встановлення набору розміром 25 та Розмір тесту - 25. Але, мабуть, це має …

3
Як би повторне зважування даних різноманітності опитування американської спільноти впливало на межі помилок?
Передумови: Моя організація в даний час порівнює статистику різноманітності робочої сили (колишні% людей з обмеженими можливостями,% жінок,% ветеранів) із загальною наявністю робочої сили для цих груп на основі Американського опитування громад (опитування проекту Бюро перепису населення США). Це неточний орієнтир, тому що у нас є дуже специфічний набір робочих місць, …

1
Чому Anova () та drop1 () надали різні відповіді для GLMM?
У мене є GLMM форми: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Під час використання drop1(model, test="Chi")я отримую інші результати, ніж якщо я використовую Anova(model, type="III")з автомобільного пакета або summary(model). Ці два останні дають однакові відповіді. Використовуючи купу сфабрикованих даних, я виявив, що …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
Гауссовий Подобається розподіл з моментами вищого порядку
Для гауссового розподілу з невідомими середніми та дисперсійними показниками достатньою статистикою у стандартній експоненціальній формі сім'ї є . У мене є розподіл, який має , де N такий, як параметр проектування. Чи існує відповідний відомий розподіл для цього виду достатнього вектора статистики? Мені потрібні зразки з цього розподілу, тому для …


3
Використання MCMC для оцінки очікуваного значення високовимірної функції
Я працюю над дослідницьким проектом, пов’язаним з оптимізацією, і нещодавно виникла ідея використовувати MCMC у цій обстановці. На жаль, я досить новачок у методах MCMC, тому у мене виникло кілька питань. Почну з опису проблеми, а потім задаю свої запитання. Наша проблема зводиться до оцінки очікуваного значення функції витрат де …

2
Як взяти вибірку з дискретного розподілу на невід’ємні цілі числа?
У мене є такий дискретний розподіл, де відомі постійні:α,βα,β\alpha,\beta p ( x ; α , β) =Бета ( α + 1 , β+ х )Бета ( α , β)для x = 0 , 1 , 2 , …p(x;α,β)=Beta(α+1,β+x)Beta(α,β)for x=0,1,2,… p(x;\alpha,\beta) = \frac{\text{Beta}(\alpha+1, \beta+x)}{\text{Beta}(\alpha,\beta)} \;\;\;\;\text{for } x = 0,1,2,\dots Які існують …

3
Рандомізація невипадкової вибірки
Я завжди трохи здивований, коли бачу психологічні рекламні оголошення щодо участі в експериментальних дослідженнях. Напевно, люди, які відповідають на ці оголошення, не є вибірковою вибіркою і тому є самовибраним населенням. Оскільки відомо, що рандомізація вирішує задачу самовибору, мені було цікаво, чи випадкова вибірка невипадкової вибірки насправді щось змінила. Як ти …

2
Чи відбір проб на основі Маркова є "найкращим" для відбору проб Монте-Карло? Чи є альтернативні схеми?
Ланцюг Маркова Монте-Карло - це метод, заснований на ланцюгах Маркова, який дозволяє отримувати зразки (в умовах Монте-Карло) з нестандартних розподілів, з яких ми не можемо безпосередньо брати зразки. Моє запитання, чому ланцюжок Маркова є "найсучаснішим" для відбору проб Монте-Карло. Альтернативним питанням може бути, чи існують інші способи, як ланцюги Маркова, …

1
Довідка для розповіді про вибірку з телефонної книги
Я сьогодні розмовляв з кимось про відбір проб і смутно пам’ятаю історію про якогось дуже шанованого статистика, який рекомендував систематичний відбір проб з телефонної книги у певній юридичній справі. Я пам’ятаю історію, яка йшла чимось на зразок судді в суді, кажучи йому щось на кшталт «Я не знаю багато про …

4
Варіант резисторів паралельно
Припустимо, у вас є набір резисторів R, всі вони розподілені із середнім μ та дисперсією σ. Розглянемо розділ ланцюга з таким компонуванням: (r) || (r + r) || (r + r + r). Еквівалентний опір кожної деталі дорівнює r, 2r та 3r. Дисперсія кожного розділу буде тоді σ2σ2σ^2 , 2σ22σ22σ^2 …

1
R лінійна регресія, категоріальна змінна значення «приховане»
Це лише приклад, на який я зустрічався кілька разів, тому у мене немає даних про вибірку. Запуск лінійної регресійної моделі в R: a.lm = lm(Y ~ x1 + x2) x1є суцільною змінною. x2категоричний і має три значення, наприклад "Низький", "Середній" та "Високий". Однак вихід, отриманий R, був би на кшталт: …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

2
Як зробити репрезентативний набір вибірки з великого загального набору даних?
Які статистичні прийоми для створення вибіркового набору, який є репрезентативним для всієї сукупності (з відомим рівнем довіри)? Також, Як перевірити, якщо зразок відповідає загальному набору даних? Чи можливо, без розбору всього набору даних (що може бути мільярдами записів)?

1
Яка модель глибокого навчання може класифікувати категорії, які не є взаємовиключними
Приклади: у мене є речення в описі посади: "Старший інженер Java у Великобританії". Я хочу використовувати модель глибокого навчання, щоб передбачити її як 2 категорії: English і IT jobs. Якщо я використовую традиційну модель класифікації, вона може передбачити лише 1 мітку з softmaxфункцією на останньому шарі. Таким чином, я можу …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
Шанс того, що зразок завантажувального пристрою точно такий же, як і оригінальний зразок
Просто хочу перевірити деякі міркування. Якщо мій оригінальний зразок має розмір і я завантажую його, то мій процес роздумів такий:nнn 1n1n\frac{1}{n} - це шанс будь-якого спостереження, отриманого з оригінальної вибірки. Щоб наступний розіграш не був попередньою вибіркою спостереження, ми обмежимо розмір вибірки до . Таким чином, ми отримуємо цю закономірність:n−1n−1n-1 …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.