Існує численні способи розрахунку ІС завантажувальної стрічки та p-значень. Основне питання полягає в тому, що завантажувальний засіб неможливо генерувати дані під нульовою гіпотезою. Перевірка на перестановку є альтернативою, що базується на життєздатному перекомпонування. Щоб використовувати належний завантажувальний засіб, ви повинні зробити деякі припущення щодо розподілу вибірки тестової статистики.
β∗0=β^−β^∗β∗0=β^∗−β^
нормальна завантажувальна
Один із підходів - це звичайний завантажувальний запуск, коли ви приймаєте середнє та стандартне відхилення розподілу завантажувальної програми, обчислюєте розподіл вибірки під нуль, зміщуючи розподіл і використовуючи нормальні відсотки від нульового розподілу в точці оцінки в початковому зразку завантажувальної програми . Це розумний підхід, коли розповсюдження завантажувальної стрічки є нормальним, візуального огляду зазвичай тут достатньо. Результати, використовуючи цей підхід, як правило, дуже близькі до надійної оцінки на основі сендвіч-помилок, яка є надійною щодо припущень щодо гетероседастичності та / або кінцевих припущень дисперсії. Припущення про нормальну статистику тесту є сильнішим умовою припущень у наступному тесті завантаження, про який я розповім.
відсотковий завантажувальний механізм
F∗02×min(F∗0(β^),1−F∗0(β^))
Вивчений завантажувач
Найпростішим рішенням для завантаження для обчислення значень є використання студизованої завантажувальної програми. З кожною ітерацією завантажувальної програми обчисліть статистику та її стандартну помилку та поверніть студенту статистику. Це дає завантажений студентом розподіл гіпотези, яку можна легко обчислити значеннями cis та p. Це також лежить в основі інтуїції, що стоїть за прискореним завантаженням прискореного завантаження. Розподіл t зміщується набагато легше під нуль, оскільки вихідні результати зменшуються за рахунок відповідної великої дисперсії.p
Приклад програмування
Як приклад, я буду використовувати city
дані в пакеті завантаження. Довірчі інтервали завантажувальної програми обчислюються за допомогою цього коду:
ratio <- function(d, w) sum(d$x * w)/sum(d$u * w)
city.boot <- boot(city, ratio, R = 999, stype = "w", sim = "ordinary")
boot.ci(city.boot, conf = c(0.90, 0.95),
type = c("norm", "basic", "perc", "bca"))
і виробляють цей вихід:
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 999 bootstrap replicates
CALL :
boot.ci(boot.out = city.boot, conf = c(0.9, 0.95), type = c("norm",
"basic", "perc", "bca"))
Intervals :
Level Normal Basic
90% ( 1.111, 1.837 ) ( 1.030, 1.750 )
95% ( 1.042, 1.906 ) ( 0.895, 1.790 )
Level Percentile BCa
90% ( 1.291, 2.011 ) ( 1.292, 2.023 )
95% ( 1.251, 2.146 ) ( 1.255, 2.155 )
Calculations and Intervals on Original Scale
95% ДІ для звичайної завантажувальної стрічки отримують шляхом обчислення:
with(city.boot, 2*t0 - mean(t) + qnorm(c(0.025, 0.975)) %o% sqrt(var(t)[1,1]))
Отримано таким чином p-значення:
> with(city.boot, pnorm(abs((2*t0 - mean(t) - 1) / sqrt(var(t)[1,1])), lower.tail=F)*2)
[1] 0.0315
Що погоджується, що 95% нормальний ІС не включає значення нульового відношення 1.
Отримується відсотковий ДІ (з деякими відмінностями через методи зв’язків):
quantile(city.boot$t, c(0.025, 0.975))
А р-значення для процентної завантажувальної стрічки:
cvs <- quantile(city.boot$t0 - city.boot$t + 1, c(0.025, 0.975))
mean(city.boot$t > cvs[1] & city.boot$t < cvs[2])
Дає ap 0,0 0,035, що також узгоджується з довірчим інтервалом з точки зору виключення 1 зі значення. Загалом ми не можемо зауважити, що, хоча ширина перцентильного CI є приблизно такою ж ширкою, як і звичайна CI, і що процентний CI далі від нуля, той, що процентний CI повинен забезпечувати менші р-значення. Це пояснюється тим, що форма розподілу вибірки, що лежить в основі ДІ для методу перцентилу, є ненормальною.