Перш за все, я перевірив би, чи є середнє значення відповідним показником для заданого завдання. Якщо ви шукаєте "типову / або центральну цінність" перекошеного розподілу, середнє може вказувати на досить нерепрезентативне значення. Розглянемо нормальний розподіл журналу:
x <- rlnorm(1000)
plot(density(x), xlim=c(0, 10))
abline(v=mean(x), col="red")
abline(v=mean(x, tr=.20), col="darkgreen")
abline(v=median(x), col="blue")
Середнє значення (червона лінія) досить далеко від основної маси даних. На 20% підстрижена середня (зелена) та медіана (синя) ближче до "типового" значення.
Результати залежать від типу вашого "ненормального" розповсюдження (корисна буде гістограма ваших фактичних даних). Якщо він не перекошений, але має важкі хвости, ваші КІ будуть дуже широкими.
У будь-якому випадку, я вважаю, що завантаження даних дійсно є хорошим підходом, оскільки це також може дати вам асиметричні ІС. R
Пакет simpleboot
є хорошим початком:
library(simpleboot)
# 20% trimmed mean bootstrap
b1 <- one.boot(x, mean, R=2000, tr=.2)
boot.ci(b1, type=c("perc", "bca"))
... дає наступний результат:
# The bootstrap trimmed mean:
> b1$t0
[1] 1.144648
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 2000 bootstrap replicates
Intervals :
Level Percentile BCa
95% ( 1.062, 1.228 ) ( 1.065, 1.229 )
Calculations and Intervals on Original Scale