Запитання з тегом «sampling»

Створення зразків із чітко визначеної сукупності за допомогою ймовірнісного методу та / або отримання випадкових чисел із заданого розподілу. Оскільки цей тег неоднозначний, будь ласка, врахуйте [опитування-вибірка] для першого та [monte-carlo] або [моделювання] для другого. З питань, що стосуються створення випадкових зразків із відомих дистрибутивів, будь ласка, розгляньте використання тегу [випадкове покоління].

3
Великі дані кластера в R та чи є вибірка релевантною?
Я новачок у науці даних і маю проблему з пошуку кластерів у наборі даних із 200 000 рядків та 50 стовпців у Р. Оскільки дані мають як числові, так і номінальні змінні, такі методи, як K-засоби, які використовують евклідову міру відстані, не здаються відповідним вибором. Тому я звертаюся до PAM, …

3
Оцініть кількість населення, що відбирається, за кількістю повторних спостережень
Скажімо, у мене є 50 мільйонів унікальних речей, і я беру 10 мільйонів зразків (із заміною) ... Перший графік, який я додав, показує, скільки разів я відбираю ту саму «річ», що є порівняно рідкісним кількість населення більша, ніж мій зразок. Однак якщо моє населення складає лише 10 мільйонів речей, і …

1
Послідовність Халтона проти послідовності Соболя?
З відповіді на попереднє запитання я був спрямований до послідовності Халтона, щоб створити набір векторів, які досить рівномірно покривали простір вибірки. Але на сторінці вікіпедії згадується, що вищі праймери особливо часто сильно корелюються на початку серіалу. Це, мабуть, має місце для будь-якої пари високих простих чисел з відносно коротким розміром …

5
Чому стверджується, що вибірка часто точніша за перепис?
При вивченні курсу вибірки я зустрічаю наступні два твердження: 1) Помилка вибірки призводить до більшої мінливості, помилки без вибірки призводять до зміщення. 2) Через помилку без вибірки зразок часто є більш точним, ніж ЦЕНЗАЛ. Я не знаю, як зрозуміти ці два твердження. Яка основна логіка отримання цих двох тверджень?

4
Чому взагалі вважають вибірку без заміни в практичному застосуванні?
Відбір проб із заміною має дві переваги перед вибіркою без заміни, як я це бачу: 1) Вам не потрібно турбуватися про обмежене виправлення популяції. 2) Є ймовірність, що елементи з популяції малюються кілька разів - тоді ви можете переробити вимірювання та заощадити час. Звичайно, з академічного POV треба досліджувати обидва …

3
Чому кілька (якщо не всі) параметричних тестів на гіпотезу припускають випадкову вибірку?
Тести, такі як Z, t та кілька інших, припускають, що дані базуються на випадковій вибірці. Чому? Припустимо, я роблю експериментальні дослідження, де я дбаю набагато більше про внутрішню обгрунтованість, ніж про зовнішню. Отже, якщо мій зразок може бути трохи упередженим, добре, як я прийняв не виводити гіпотезу для цілих груп …

2
Як ми можемо отримати нормальний розподіл як
Скажімо, у нас є випадкова величина з діапазоном значень, обмежених і b , де a - мінімальне значення, а b - максимальне значення.аaaбbbаaaбbb Мені сказали, що як , де n - наш розмір вибірки, розподіл вибірки нашої вибіркової форми є нормальним розподілом. Тобто, як ми збільшуємо п ми стаємо ближче …

3
Визначте, чи значно покращився процес поширення важких хвостів
Я спостерігаю за часом обробки процесу до та після зміни, щоб з'ясувати, чи покращився процес зміною. Процес покращився, якщо скоротити час обробки. Час розподілу часу обробляється жиром, тому порівняння на основі середнього значення не є розумним. Натомість хотілося б знати, чи вірогідність спостерігати менший час обробки після зміни значно вище …

1
Відмінності між PROC змішаними та lme / lmer у R - ступенями свободи
Примітка: це запитання є репостом, оскільки моє попереднє питання довелося видалити з юридичних причин. Порівнюючи PROC MIXED від SAS з функцією lmeз nlmeпакету в R, я натрапив на деякі досить заплутані відмінності. Більш конкретно, ступеня свободи в різних випробувань відрізняються між PROC MIXEDі lme, і я задавався питанням, чому. Почніть …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
Як швидко взяти вибірку X, якщо exp (X) ~ Gamma?
У мене проста проблема вибірки, де виглядає моя внутрішня петля: v = sample_gamma(k, a) де sample_gammaзразки з розподілу Гамми утворюють зразок Діріхле. Це працює добре, але для деяких значень k / a деякі з обчислень нижче за течією підпадають. Я адаптував його до використання змінних простору журналу: v = log(sample_gamma(k, …

1
Чому теорема про центральну межу працює з одним зразком?
Мене завжди вчили, що CLT працює при повторному відборі проб, причому кожен зразок є достатньо великим. Наприклад, уявіть, що у мене є країна з 1 000 000 громадян. Я розумію CLT, що навіть якщо розподіл їх висоти не було нормальним, якщо я взяв 1000 зразків по 50 осіб (тобто проводив …

2
Методи MCMC - спалювання зразків?
У методах MCMC я постійно читаю про burn-inчас або кількість зразків "burn". Що це саме, і навіщо це потрібно? Оновлення: Після того, як MCMC стабілізується, чи залишається він стабільним? Як поняття burn-inчасу пов'язане з поняттям часу перемішування?
12 sampling  mcmc 

1
Інтуїтивні приклади вибірки важливості
Мій досвід - інформатика. Я досить новий, щоб монтувати методи відбору проб Карло, і, хоча я розумію математику, мені важко придумати інтуїтивні приклади для вибірки важливості. Точніше, чи міг би хтось навести приклади: оригінальний розподіл, з якого неможливо взяти вибірку, але можна оцінити розподіл важливості, який можна взяти на вибірку …

3
Як перепрограмувати R без повторень перестановок?
У R, якщо я set.seed (), а потім використовую функцію вибірки для рандомізації списку, чи можу я гарантувати, що я не буду генерувати ту саму перестановку? тобто ... set.seed(25) limit <- 3 myindex <- seq(0,limit) for (x in seq(1,factorial(limit))) { permutations <- sample(myindex) print(permutations) } Це виробляє [1] 1 2 …

1
Вибірка з граничного розподілу з використанням умовного розподілу?
Я хочу взяти вибірку з одновимірної щільності але я знаю лише взаємозв'язок:fХfXf_X fХ( x ) = ∫fХ| Y( х | у) fY( у) dу.fХ(х)=∫fХ|Y(х|у)fY(у)гу.f_X(x) = \int f_{X\vert Y}(x\vert y)f_Y(y) dy. Я хочу уникати використання MCMC (безпосередньо на інтегральному поданні), і оскільки і легко , я думав про використання наступного пробника …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.