З урахуванням N вибіркових значень, що означає "p-й квантил вибіркових значень"?
З урахуванням N вибіркових значень, що означає "p-й квантил вибіркових значень"?
Відповіді:
Теоретично (з ) це означає, що частка є часткою вгору кумулятивного розподілу. На практиці використовуються різні визначення, зокрема в статистичних обчисленнях. Наприклад, в R є дев'ять різних визначень , перші три для дискретної інтерпретації, а решта для різноманітних безперервних інтерполяцій.
Ось приклад: якщо ваш зразок {400, 1, 1000, 40}, а ви шукаєте 0,6 квантил (60-й центіл), то різні методи обчислення дають
> for (t in 1:9) { x[t] <- quantile(c(400, 1, 1000, 40), probs=0.6, type = t ) }
> x
60%
400 400 40 184 364 400 328 376 373
Моя особиста думка полягає в тому, що правильна цифра полягає в тому, що 400 є правильним, оскільки Це відбувається від трактування вибірки як сукупності, і якщо емпіричний CDF буде проведений, це буде послідовність етапів. Існують протилежні аргументи для інтерполяції, тому емпіричний CDF є безперервним, оскільки це може бути кращим або кориснішим наближенням до сукупності, а метод інтерполяції вплине на результат.