Ваш підручник заплутаний. Дуже мало людей або програмного забезпечення визначають квартири таким чином. (Як правило, перший квартал стає занадто малим, а третій - дуже великим.)
quantile
Функція R
реалізує дев'ять різних способів обчислювальних квантилів! Щоб побачити, який із них, якщо такий є, відповідає цьому методу, почнемо з його реалізації. З опису ми можемо написати алгоритм спочатку математично, а потім у R
:
Замовте дані .х1≤x2≤⋯≤xn
Для будь-якого набору даних медіана - це його середнє значення, коли є непарне число значень; інакше це середнє значення двох середніх значень, коли є парне число значень. R
«S median
функція обчислює це.
Індекс середнього значення . Коли це не є цілим числом, є медіаною, де і є закруглені вниз і вгору. В іншому випадку, коли - ціле число, - медіана. У такому випадку візьміть і . У будь-якому випадку - індекс значення даних безпосередньо зліва від медіани, а - індекс значення даних безпосередньо праворуч від медіани.m=(n+1)/2(xl+xu)/2lummxml=m−1u=m+1lu
"Перший квартал" є медіаною всіх для яких . "Третій квартал" є медіаною для якої .хii ≤ l( хi)i ≥ u
Ось реалізація. Це може допомогти вам виконувати свої вправи в цьому підручнику.
quart <- function(x) {
x <- sort(x)
n <- length(x)
m <- (n+1)/2
if (floor(m) != m) {
l <- m-1/2; u <- m+1/2
} else {
l <- m-1; u <- m+1
}
c(Q1=median(x[1:l]), Q3=median(x[u:n]))
}
Наприклад, висновок quart(c(6,7,8,9,10,15,16,16,20,20,23,33,50,58,104))
відповідає тексту:
Q1 Q3
9 33
Давайте обчислимо квартилі для деяких невеликих наборів даних, використовуючи всі десять методів: дев'ять у R
та підручник:
y <- matrix(NA, 2, 10)
rownames(y) <- c("Q1", "Q3")
colnames(y) <- c(1:9, "Quart")
for (n in 3:5) {
j <- 1
for (i in 1:9) {
y[, i] <- quantile(1:n, probs=c(1/4, 3/4), type=i)
}
y[, 10] <- quart(1:n)
cat("\n", n, ":\n")
print(y, digits=2)
}
Якщо запустити це і перевірити, ви побачите, що значення підручника не відповідають жодному з R
результатів для всіх трьох розмірів вибірки. (Шаблон розбіжностей триває протягом циклів третього періоду, показуючи, що проблема зберігається незалежно від того, наскільки великою може бути вибірка.)
9.528
quantile
типи 1, 2 і 6 будуть відтворювати їх для набору даних саме цього розміру . Жоден ізR
методів не відповідає вашому підручнику. (