Запитання з тегом «resampling»

Переустановка - це взяття проби з проби. Найпоширенішими способами є jackknifing (взяття підпроби, наприклад, всі значення, крім 1), і завантажувальна програма (вибірки з заміною). Ці методи можуть дати надійну оцінку розподілу вибірки, коли було б важко або неможливо отримати аналітичний аналіз.

3
Як перепрограмувати R без повторень перестановок?
У R, якщо я set.seed (), а потім використовую функцію вибірки для рандомізації списку, чи можу я гарантувати, що я не буду генерувати ту саму перестановку? тобто ... set.seed(25) limit <- 3 myindex <- seq(0,limit) for (x in seq(1,factorial(limit))) { permutations <- sample(myindex) print(permutations) } Це виробляє [1] 1 2 …

1
Чи підходить завантажувальна програма для цих постійних даних?
Я повний новачок :) Я роблю дослідження з розміром вибірки 10 000 від населення близько 745 000. Кожен зразок являє "відсоткову схожість". Переважна більшість зразків становить приблизно 97% -98%, але кілька - від 60% до 90%, тобто розподіл сильно негативно перекошений. Приблизно 0,6% результатів становлять 0%, але вони будуть розглянуті …

1
Методологія завантаження. Навіщо перепробовувати "із заміною" замість випадкової підсистеми?
Метод завантаження в останні роки відчував велику дифузію в останні роки, я також його дуже багато використовую, тим більше, що міркування досить інтуїтивно зрозумілі. Але це одне, чого я не розумію. Чому Efron вирішив виконати повторний вибір із заміною, а не просто підпрограмувати шляхом випадкового включення або виключення одиничних спостережень? …

1
Коефіцієнт Джині та межі помилок
У мене є часовий ряд даних з N = 14 підрахунків у кожний момент часу, і я хочу обчислити коефіцієнт Джіні та стандартну помилку для цієї оцінки в кожний момент часу. Так як у мене є лише N = 14 підрахунків у кожній точці часу, я продовжував обчислення дисперсії джек-ножа, …

4
Чому тести гіпотез щодо повторно впорядкованих наборів даних занадто часто відкидають нуль?
tl; dr: Починаючи з набору даних, згенерованого під нуль, я перекомпонував випадки із заміною та провів перевірку гіпотез на кожному перекомпонованому наборі даних. Ці тести гіпотези відкидають нуль більше 5% часу. нижче, дуже просте моделювання, я набори даних за допомогою , і я підходжу просту модель OLS до кожного. Потім …

2
Чи слід завантажувати завантажувач на рівні кластерів чи на індивідуальному рівні?
У мене є модель виживання з пацієнтами, які вкладаються в лікарні, яка включає випадковий ефект для лікарень. Випадковий ефект розподілений гаммою, і я намагаюся повідомити про «актуальність» цього терміна в масштабі, який легко зрозуміти. Я знайшов наступні посилання, які використовують середнє співвідношення небезпеки (трохи схоже на коефіцієнт середнього шансу), і …

2
Хороший текст для перекомпонування?
Чи може група рекомендувати хороший вступний текст / ресурс до застосованих методів перестановки? Зокрема, мене цікавлять альтернативи класичним параметричним тестам (наприклад, t-тести, ANOVA, ANCOVA) для порівняння груп, коли припущення, такі як нормальність, явно порушуються. Приклад типу проблеми, з якою я хотів би ознайомитись з найкращим способом вирішення, може включати щось …

1
Яка модель глибокого навчання може класифікувати категорії, які не є взаємовиключними
Приклади: у мене є речення в описі посади: "Старший інженер Java у Великобританії". Я хочу використовувати модель глибокого навчання, щоб передбачити її як 2 категорії: English і IT jobs. Якщо я використовую традиційну модель класифікації, вона може передбачити лише 1 мітку з softmaxфункцією на останньому шарі. Таким чином, я можу …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Розмір завантажувальних зразків
Я дізнаюсь про завантажувальний процес як про засіб оцінки дисперсії вибіркової статистики. У мене є одне основне сумнів. Цитуючи з http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Скільки спостережень слід повторно проаналізувати? Гарна пропозиція - оригінальний розмір зразка. Як ми можемо повторно проаналізувати стільки спостережень, скільки в оригінальній вибірці? Якщо у мене розмір вибірки …

1
Перебіг з категоричними змінними
Мені хотілося б виконати комбінацію пересимплінгу та недооцінки, щоб збалансувати мій набір даних із приблизно 4000 клієнтами, розділеними на дві групи, де одна з груп становить приблизно 15%. Я вивчив SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) та ROSE ( http://cran.r-project.org/web/packages/ROSE/ ROSE.pdf ), але обидва вони створюють нові синтетичні зразки, використовуючи існуючі спостереження …

1
Чи можна переустановку завантажувальної програми використовувати для обчислення довірчого інтервалу для дисперсії набору даних?
Я знаю, що якщо ви повторно відбираєте вибірку з набору даних багато разів і обчислюєте середнє значення кожного разу, ці засоби будуть послідувати нормальний розподіл (за CLT). Таким чином, ви можете обчислити довірчий інтервал на середньому наборі даних, не роблячи припущень щодо розподілу ймовірності набору даних. Мені було цікаво, чи …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.