Запуск завантаження не передбачає жодних знань про форму основного розподілу батьків, з якого виникла вибірка. Традиційні класичні оцінки статистичних параметрів базуються на припущенні про нормальність. Bootstrap має справу з ненормальністю і є більш точним на практиці, ніж класичні методи.
Запуск завантажувальних програм замінює сильну обчислювальну здатність комп'ютерів для суворого теоретичного аналізу. Це оцінка для вибіркового розподілу терміна помилки набору даних. Запуск завантаження включає: повторний вибірки набору даних задану кількість разів, обчислення середнього значення з кожного зразка та знаходження стандартної похибки середнього.
Наступний код "R" демонструє концепцію:
Цей практичний приклад демонструє корисність завантаження та оцінює стандартну помилку. Стандартна помилка потрібна для обчислення довірчого інтервалу.
Припустимо, у вас є перекошений набір даних "a":
a<-rexp(395, rate=0.1) # Create skewed data
візуалізація перекошеного набору даних
plot(a,type="l") # Scatter plot of the skewed data
boxplot(a,type="l") # Box plot of the skewed data
hist(a) # Histogram plot of the skewed data
Виконайте процедуру завантаження:
n <- length(a) # the number of bootstrap samples should equal the original data set
xbarstar <- c() # Declare the empty set “xbarstar” variable which will be holding the mean of every bootstrap iteration
for (i in 1:1000) { # Perform 1000 bootstrap iteration
boot.samp <- sample(a, n, replace=TRUE) #”Sample” generates the same number of elements as the original data set
xbarstar[i] <- mean(boot.samp)} # “xbarstar” variable collects 1000 averages of the original data set
##
plot(xbarstar) # Scatter plot of the bootstrapped data
boxplot(xbarstar) # Box plot of the bootstrapped data
hist(xbarstar) # Histogram plot of the bootstrapped data
meanOfMeans <- mean(xbarstar)
standardError <- sd(xbarstar) # the standard error is the standard deviation of the mean of means
confidenceIntervalAboveTheMean <- meanOfMeans + 1.96 * standardError # for 2 standard deviation above the mean
confidenceIntervalBelowTheMean <- meanOfMeans - 1.96 * standardError # for 2 standard deviation above the mean
confidenceInterval <- confidenceIntervalAboveTheMean + confidenceIntervalBelowTheMean
confidenceInterval