Запитання з тегом «bootstrap»

Завантажувальний засіб - це метод перекомпонування для оцінки розподілу вибірки статистики.

3
Тестування гіпотез Bootstrap vs. permutation
Існує кілька популярних методів перестановки, які часто використовуються на практиці, такі як завантажувальний запуск, перестановка на перестановку, джекніф і т. Д. Існують численні статті та книги, які обговорюють ці методи, наприклад , тести перестановки, параметричні та завантажувальні функції «Філіпп I хороший» (2010). Гіпотези Моє запитання, яка техніка перекомпонування отримала більшу …

5
Чи можете ви переобладнати, навчаючи алгоритми машинного навчання за допомогою CV / Bootstrap?
Це питання може бути занадто відкритим, щоб отримати остаточну відповідь, але, сподіваємось, ні. Алгоритми машинного навчання, такі як SVM, GBM, Random Forest тощо, як правило, мають деякі вільні параметри, які, крім деякого правила керівництва, повинні бути налаштовані на кожен набір даних. Як правило, це робиться за допомогою певної техніки повторного …

3
Яким чином випадкові ліси не чутливі до людей, що пережили?
Я читав у кількох джерелах, включаючи це , про те, що випадкові ліси не чутливі до людей, що переживають люди (наприклад, Логістична регресія та інші методи боротьби з МС). Однак дві інтуїції говорять мені про інше: Щоразу, коли будується дерево рішень, усі точки повинні бути класифіковані. Це означає, що навіть …

2
Визначення розміру вибірки, необхідного для завантажувального методу / Пропонований метод
Я знаю, що це досить гаряча тема, де ніхто насправді не може дати просту відповідь. Тим не менш, мені цікаво, чи не може бути корисним наступний підхід. Метод завантаження корисний лише в тому випадку, якщо ваш зразок дотримується більш-менш (читайте точно) того ж розподілу, що і вихідний сукупність. Для того, …

2
Як ви робите завантаження даних за даними часових рядів?
Нещодавно я дізнався про використання методів завантаження для обчислення стандартних помилок та довірчих інтервалів для оцінювачів. Що я дізнався, це те, що якщо дані є IID, ви можете ставитися до вибіркових даних як до сукупності, і робити вибірки із заміною, і це дозволить отримати кілька моделей тестової статистики. Що стосується …

4
Чи правда, що процентний завантажувальний пристрій ніколи не повинен використовуватися?
У примітках MIT OpenCourseWare за 18.05. Вступ до ймовірностей та статистики, Весна 2014 року (зараз доступний тут ), вказується: Метод первинного завантаження привабливий завдяки своїй простоті. Однак це залежить від розподілу завантажувального завантаження на основі конкретного зразка, який є хорошим наближенням до справжнього розподілу . Райс говорить про метод процентиля, …

4
Коли справедлива оцінка завантаження для зміщення?
Часто стверджується, що завантажувальне завантаження може забезпечити оцінку зміщення в оцінці. Якщо - оцінка для деякої статистики, і - це репліки завантажувальної програми (з ), то оцінка завантаження завантажувальної зсуву \ \ {{рівняння} \ mathrm {упередженість} _t \ приблизно \ frac {1} {N} \ sum_i \ tilde {t} _i- \ …
31 bootstrap  bias 

2
Чи існує надійний непараметричний інтервал довіри для середнього косого розподілу?
Дуже перекошені розподіли, такі як log-normal, не призводять до точних довірчих інтервалів завантаження. Ось приклад, який показує, що область лівого і правого хвостів далека від ідеальних 0,025, незалежно від того, який метод завантажувального пристрою ви намагаєтеся виконати в R: require(boot) n <- 25 B <- 1000 nsim <- 1000 set.seed(1) …

3
Рекомендація для рецензованого журналу з відкритим кодом?
У мене є рукопис методу завантаження для тестування гіпотез одного засобу, і я хотів би надіслати його для публікації, але у мене є моральна дилема. Я підписався на протест проти Ельзев'є за їх неетичну ділову практику, і читання усього питання справді змусило мене поставити під сумнів етику інших комерційних академічних …

3
Чому б не повідомити про середню кількість завантажувального завантаження?
Коли одна завантажує параметр для отримання стандартної помилки, ми отримуємо розподіл параметра. Чому ми не використовуємо середнє значення цього розподілу як результат або оцінку для параметра, який ми намагаємося отримати? Чи не повинен розподіл наближатись до реального? Тому ми отримали б хорошу оцінку "реальної" вартості? Але ми повідомляємо про вихідний …

5
Чому мій інтервал завантаження має жахливе покриття?
Я хотів провести демонстрацію класу, де я порівнюю t-інтервал з інтервалом завантаження і обчислив вірогідність покриття обох. Я хотів, щоб дані надходили з перекошеного розподілу, тому я вирішив генерувати дані як exp(rnorm(10, 0, 2)) + 1зразок розміром 10 із зрушеної лонормальної. Я написав сценарій, щоб намалювати 1000 зразків і, для …

2
Наскільки добре завантажувальна оцінка наближає розподіл вибірки оцінювача?
Нещодавно вивчивши завантажувальний тренажер, я придумав концептуальне питання, яке все ще мене спантеличує: У вас населення, і ви хочете знати атрибут популяції, тобто , де я використовую для представлення населення. Наприклад, ця може бути середньою кількістю населення. Зазвичай ви не можете отримати всі дані від населення. Отже, ви намалюєте зразок …

1
Інтервал прогнозу завантаження
Чи існує яка-небудь методика завантаження для обчислення інтервалів прогнозування для прогнозування точок, отриманих, наприклад, від лінійної регресії або іншого методу регресії (k-найближчий сусід, регресійні дерева тощо)? Я якось відчуваю, що іноді пропонований спосіб просто скористатися точковим прогнозуванням (див., Наприклад, інтервали прогнозування для регресії kNN ) не забезпечує інтервал прогнозування, а …

3
Обчислення p-значення за допомогою завантажувальної програми з R
Я використовую пакет "boot" для обчислення приблизного двостороннього завантаженого p-значення, але результат занадто далекий від p-значення використання t.test. Я не можу зрозуміти, що я зробив не так у своєму R-коді. Може хтось, будь ласка, підкаже мені про це time = c(14,18,11,13,18,17,21,9,16,17,14,15, 12,12,14,13,6,18,14,16,10,7,15,10) group=c(rep(1:2, each=12)) sleep = data.frame(time, group) require(boot) diff …

1
Чи може ступінь свободи бути цілим числом?
Коли я використовую GAM, це дає мені залишковий коефіцієнт DF (останній рядок у коді). Що це означає? Виходячи за приклад GAM, загалом, чи може число ступенів свободи бути нецілим числом?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.