Я маю знайти 95% ІС на медіані та інших відсотках. Я не знаю, як до цього підійти. В основному я використовую R як інструмент програмування.
Я маю знайти 95% ІС на медіані та інших відсотках. Я не знаю, як до цього підійти. В основному я використовую R як інструмент програмування.
Відповіді:
Ось ілюстрація класичного набору даних R:
> x = faithful$waiting
> bootmed = apply(matrix(sample(x, rep=TRUE, 10^4*length(x)), nrow=10^4), 1, median)
> quantile(bootmed, c(.025, 0.975))
2.5% 97.5%
73.5 77
що дає (73.5, 77) довірчий інтервал на медіані.
( Примітка: Виправлена версія, завдяки Джону . Я використовував в раніше, що призвело до плутанини!)nrow
Інший підхід ґрунтується на квантилах біноміального розподілу.
наприклад:
> x=faithful$waiting
> sort(x)[qbinom(c(.025,.975), length(x), 0.5)]
[1] 73 77
Перевірте перекомпонування завантажувальної програми. Довідка пошуку R для функції завантаження. Залежно від ваших даних за допомогою перекомпонування, ви можете оцінювати довірчі інтервали майже для всього.
wilcox.test(..., conf.int=TRUE)
функцій R, наприклад .
Є й інші підходи: один заснований на тесті Wilcoxon Rank Sum, застосованому для одного зразка з корекцією безперервності. У R це може бути подано у вигляді:
wilcox.test(x,conf.level=0.95,alternative="two.sided",correct=TRUE)
Ось тут обговорюється медіана ІР Девіда Оліва для медіани:
Результат, заснований на підході qbinom, не правильний для малих зразків. Припустимо, що x має 10 компонентів. Тоді qbinom (c (.025, .975), 10, .5) дає 2 і 8. Отриманий інтервал не розглядає статистику порядку в нижньому хвості симетрично з тими, що знаходяться у верхньому хвості; Ви повинні отримати або 2, і 9, або 3 і 8. Правильна відповідь - 2 і 9. Ви можете перевірити, чи не є однонаціональним в SAS. Ловити тут вам потрібно не більше 0,525 ймовірності нижче і вище; нижній квантил цього не робить, оскільки він дає щонайменше .025 в і нижче. Ви зберігаєтеся внизу, тому що кількість, яка повинна бути 1, повинна бути зіставлена на статистику другого порядку, нараховуючи 0, і тому "вимкнути один" скасовується. Це випадкове скасування не відбувається зверху, і тому ви отримуєте неправильну відповідь тут. Сортування коду (x) [qbinom (c (.025, .975), довжина (x) ,. 5) + c (0,1)] майже працює, і .5 можна замінити на інші кількісні значення, щоб отримати довірчі інтервали для інших квантилів, але це не буде правильно, коли існує такий, що P [X <= a ] =. 025. Див., Наприклад, Хіггінса, непараметричні статистичні дані.
library(boot)
видається, підтверджують це:> boot.ci (boot (x, функція (x, i)) медіана (x [i]), R = 1000)) Інтервали: рівень нормальний базовий 95% (74,42, 78,22) (75,00 , 78.49) Рівень Процентний BCa 95% (73.51, 77.00) (73.00, 77.00)