Запитання з тегом «population»

Сукупність - це вся сукупність одиниць, з яких може бути вибірка.

12
Чому інтервал довіри 95% (CI) не передбачає 95% шансу містити середнє значення?
Здається, що через різні пов'язані з цим питання тут існує консенсус, що "95%" частина того, що ми називаємо "95% довірчим інтервалом", посилається на те, що якби ми багато разів точно повторювали наші процедури вибірки та обчислення CI 95% таким чином обчислених КІ містили б середнє значення для населення. Крім того …

25
Розміщення вільно доступних зразків даних
Я працював над новим методом аналізу та аналізу наборів даних для ідентифікації та ізоляції підгруп населення без попереднього усвідомлення особливостей будь-якої підгрупи. Хоча метод досить добре працює зі штучними зразками даних (тобто наборами даних, створеними спеціально для ідентифікації та сегрегації підмножини населення), я хотів би спробувати протестувати його з живими …

5
Яка різниця між N і N-1 при обчисленні дисперсії населення?
Я не зрозумів, чому існують, Nі N-1під час розрахунку дисперсії населення. Коли ми використовуємо Nі коли ми використовуємо N-1? Клацніть тут для більшої версії Це говорить про те, що коли дуже велика кількість населення, різниці між N і N-1 немає, але це не говорить про те, чому існує N-1 на …

5
Статистичний висновок, коли вибіркою "є" сукупність
Уявіть, що ви повинні звітувати про кількість кандидатів, які щорічно проходять тест. Здається, досить складно зробити висновок про спостережуваний відсоток успіху, наприклад, на більш широкій сукупності через специфіку цільової сукупності. Тож ви можете врахувати, що ці дані представляють всю сукупність. Чи є результати тестів, які свідчать про те, що пропорції …


3
Статистичні методи для даних, де відомо лише мінімальне / максимальне значення
Чи існує галузь статистики, яка займається даними, для яких точні значення невідомі , але для кожної окремої людини ми знаємо або максимальне, або мінімальне значення, пов'язане зі значенням ? Я підозрюю, що моя проблема багато в чому випливає з того, що я намагаюся сформулювати її в статистичному плані, але, сподіваюся, …

3
Оцінка чисельності популяції за частотою вибіркових дублікатів та унікальних даних
Є веб-служба, де я можу запитати інформацію про випадковий предмет. Для кожного запиту кожен товар має рівний шанс повернути його. Я можу продовжувати запитувати предмети та записувати кількість дублікатів та унікальних. Як я можу використовувати ці дані для оцінки загальної кількості позицій?

3
Використовуючи середню довжину та середню вагу для обчислення середнього ІМТ?
Чи справедливо використовувати середню довжину ( ) та середню вагу ( )) від даної сукупності для обчислення середнього показника ( ) для цієї популяції?годhhшwwБ МЯ= шгод2BMI=wh2BMI = \frac{w}{h^2}

4
Чи є якась кількісна властивість населення «параметром»?
Я відносно знайомий з різницею між термінами статистика та параметр. Я бачу статистику як значення, отримане від застосування функції до вибіркових даних. Однак більшість прикладів параметрів стосуються визначення параметричного розподілу. Поширений приклад - середнє та стандартне відхилення для параметризації нормального розподілу або коефіцієнтів та відхилень помилок для параметризації лінійної регресії. …

1
Пакет GBM проти Caret з використанням GBM
Я налаштовував модель за допомогою caret, але потім повторно запустив модель за допомогою gbmпакета. Наскільки я розумію, що caretпакет використовує gbmі вихід повинен бути однаковим. Однак, лише швидкий тестовий пробіг із застосуванням data(iris)показує невідповідність моделі приблизно 5%, використовуючи RMSE і R ^ 2 в якості метрики оцінювання. Я хочу знайти …

1
Чоловіки та жінки в шахи - очікувані розбіжності на хвостах розподілу
Мене цікавлять висновки цього документу 2009 року: Чому (найкращі) жінки так добре в шахах? Рівень участі та гендерні відмінності в інтелектуальних сферах Ця стаття намагається пояснити, чому самі кращі шахістки чоловічої статі виявляються набагато кращими, ніж самі найкращі гравці (жінки складають лише 2% від 1000 кращих гравців у світі). Зокрема, …

2
Ухил у середньому віці для кваліфікації звання гросмайстра за віковими групами?
Вже досить давно відомо, що наймолодший вік, в якому шахісти зуміли отримати право на титул гросмейстера, значно зменшився з 1950-х років, і наразі майже 30 гравців, які стали гросмейстером до свого 15-го дня народження . Однак на біржі шахових стеків виникає питання, який середній вік, щоб стати гросмейстером? . Хтось …

2
Чи має сенс обчислювати довірчі інтервали та перевіряти гіпотези, коли дані цілої сукупності доступні?
Чи є сенс обчислювати довірчі інтервали та перевіряти гіпотези, коли дані доступні для всієї сукупності? На мою думку, відповідь - ні, оскільки ми можемо точно обчислити справжні значення параметрів. Але тоді, яка максимальна частка даних від вихідної сукупності дозволяє нам використовувати вищезгадані методи?

1
R лінійна регресія, категоріальна змінна значення «приховане»
Це лише приклад, на який я зустрічався кілька разів, тому у мене немає даних про вибірку. Запуск лінійної регресійної моделі в R: a.lm = lm(Y ~ x1 + x2) x1є суцільною змінною. x2категоричний і має три значення, наприклад "Низький", "Середній" та "Високий". Однак вихід, отриманий R, був би на кшталт: …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
Оцінка кількості кульок шляхом послідовного вибору кулі та маркування
Скажімо, у мене в мішку N куль. На своєму першому розіграші я відзначаю м'яч і замінюю його в мішку. На другому розіграші, якщо я беру позначений кулю, повертаю його в сумку. Якщо, однак, я беру не помічений кулю, то відзначаю його і повертаю в сумку. Я продовжую це для будь-якої …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.