Запитання з тегом «proportion»

Пропорція - частка якоїсь сукупності, яка є певним видом, або (i) як підрахунок одного виду речі із загальної кількості, або (ii) як складова суцільної змінної.

3
Приклад: регресія LASSO з використанням glmnet для двійкового результату
Я починаю балуватися з використанням glmnetз LASSO регресією , де мій результат становить інтерес дихотомический. Я створив невеликий макетний кадр даних нижче: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

2
Який взаємозв'язок між тестом чи-ква та тестом рівних пропорцій?
Припустимо, у мене є три групи з чотирма взаємовиключними характеристиками. Я беру випадкові зразки з кожної сукупності і будую перехресну таблицю або таблицю частот для характеристик, які я вимірюю. Чи правильно я кажу, що: Якщо я хотів би перевірити, чи існує взаємозв'язок між сукупністю та характеристиками (наприклад, чи одна популяція …

4
Точні дві пропорції вибірки біноміального тесту в R (і деякі дивні p-значення)
Я намагаюся вирішити таке питання: Гравець A виграв 17 з 25 ігор, а гравець B виграв 8 із 20 - чи є значна різниця між обома співвідношеннями? Що потрібно зробити в R, що спадає на думку: > prop.test(c(17,8),c(25,20),correct=FALSE) 2-sample test for equality of proportions without continuity correction data: c(17, 8) …


3
Безпечне визначення розміру вибірки для тестування A / B
Я інженер програмного забезпечення, який прагне створити інструмент для тестування а / б . У мене немає твердої статистики, але я читав зовсім небагато читань протягом останніх кількох днів. Я дотримуюсь описаної тут методики і підсумую відповідні моменти нижче. Інструмент дозволить дизайнерам та експертам домену налаштувати веб-сайт для розподілу трафіку, …

4
Які правильні значення для точності та відкликання у кращих випадках?
Точність визначається як: p = true positives / (true positives + false positives) Чи правильно, що як true positivesі false positivesпідхід 0, точність наближається до 1? Те саме запитання для відкликання: r = true positives / (true positives + false negatives) Зараз я впроваджую статистичний тест, де мені потрібно обчислити …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

1
На якому рівні тест
Передумови: Пропустити безпечно - це тут для довідки та узаконити питання. У відкритті цього документу написано: "Знаменитий тест на випадок надзвичайної ситуації Карла Пірсона отриманий з іншої статистики, званої z статистикою z, заснованої на нормальному розподілі. Найпростіші версії χ2χ2\chi^2 можуть бути математично ідентичні еквівалентним z тестам. Тести дають той же …

5
Чи можна використовувати квадрат чи для порівняння пропорцій?
Я читав, що тест квадратних чі корисний, щоб дізнатись, чи суттєво відрізняється зразок від набору очікуваних значень. Наприклад, ось таблиця результатів опитування улюблених кольорів людей (n = 15 + 13 + 10 + 17 = 55 загалом респондентів): red,blue,green,yellow 15,13,10,17 Тест на квадрат чі може мені сказати, чи цей зразок …

1
Інтерпретація пропорцій, що дорівнюють одиниці як незалежні змінні в лінійній регресії
Мені знайоме поняття категоричних змінних та відповідне кодування фіктивних змінних, що дозволяє нам підходити до одного рівня як базового рівня, щоб уникнути колінеарності. Мені також знайоме, як інтерпретувати оцінки параметрів з таких моделей: Передбачувана зміна результату для заданого відповідного рівня категоричного прогноктора стосовно базової категорії. Я не впевнений у тому, …

1
Яка різниця між "пропорціями підрахунку" та "суцільними пропорціями"?
У коментарі до іншого питання було задано уточнення, чи обговорювана тема була "пропорцією підрахунку" або "безперервними пропорціями", і подальший аналіз вказав, що різниця є критичною інформацією (до теми логістичного / біноміального та бета-регресії). У чому полягає відмінність між ними, і де це відмінність? Які важливі речі слід пам’ятати при роботі …

2
Використання lm для 2-пробного тесту на пропорцію
Я деякий час використовував лінійні моделі для виконання тестів на 2 вибірки, але зрозумів, що це може бути не зовсім коректно. Здається, що використання узагальненої лінійної моделі з двочленним сімейством + ідентифікаційним зв’язком дає саме непідкупчені 2-вибіркові пропорційні результати тесту. Однак використання лінійної моделі (або glm з гауссова сім'я) дає …

1
Який найбільш підходящий спосіб перетворення пропорцій, коли вони є незалежною змінною?
Я думав, що розумію це питання, але зараз я не такий впевнений і хотів би поговорити з іншими, перш ніж продовжувати. У мене є дві змінні, Xі Y. Yє співвідношенням, і воно не обмежене 0 і 1 і, як правило, нормально розподілене. Xє пропорцією, і вона обмежена 0 і 1 …

5
Як виконати імпутацію значень у дуже великій кількості точок даних?
У мене дуже великий набір даних, і близько 5% випадкових значень відсутні. Ці змінні співвідносяться між собою. Наступний приклад набору даних R - це лише іграшковий приклад з манекено-корельованими даними. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
Клопер-Пірсон для не математиків
Мені було цікаво, чи може хтось пояснити мені інтуїцію поза межами CI Clopper-Pearson за пропорціями. Наскільки мені відомо, кожна CI включає в неї дисперсію. Однак для пропорцій, навіть якщо моя частка дорівнює 0 або 1 (0% або 100%), CI Clopper-Pearson можна розрахувати. Я спробував розглянути формули, і я розумію, що …

2
-test В.С. -test для порівняння шансів підхопити застуду в 2 -х групах
Я просто читав у досить шанованому (популярному) науковому журналі (німецький прем’єр, 02/2013, с.36) про цікавий експеримент (без джерела, на жаль). Це привернуло мою увагу, тому що інтуїтивно я сумнівався у важливості результату, але надана інформація була достатньою для відтворення статистичного тестування. Дослідники задалися питанням, чи збільшує холодність у холодну погоду …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.