Що це означає, якщо медіана або середня сума більша за суму доданих?


13

Я аналізую розподіл затримки в мережі. Середній час завантаження (U) становить 0,5 с. Середній час завантаження (D) - 2 секунди. Однак середній загальний час (для кожної точки даних T = U + D) становить 4s.

Які висновки можна зробити, знаючи, що медіана суми набагато більша за суму медіани доданків?

Щось із цікавості до статистики, що це означатиме, якби це питання замінило медіану середньою?


3
FYI, це не може бути правдою середнього значення, оскільки воно лінійне: , те ж саме стосується і вибіркових середніх значень. E[X+Y]=EX+EY
Дугал

Відповіді:


8

Медіани не є лінійними, тому існують різноманітні обставини, за яких може статися щось подібне (тобто ) .median(X1)+median(X2)<median(X1+X2)

Дуже просто побудувати окремі приклади, коли така річ відбувається, але це також часто в постійних ситуаціях.

Наприклад, це може статися зі скошеним безперервним розподілом - при важкому правильному хвості медіани можуть бути і невеликими, але медіана суми "підтягується", тому що є хороший шанс, що один з двох великий, і значення вище медіана, як правило, буде набагато вище її, роблячи медіану суми більшою, ніж сума медіани.

Ось явний приклад: Візьміть . Тоді і мають медіану тому сума медіани менше , але що має медіану (насправді відповідно до Вольфрама Альфи)X1X2log(2)0,6931,4X1+X2Gamma(2,1)1,667-W-1(-1X1,X2i.i.d.Exp(1)X1X2log(2)0.6931.4X1+X2Gamma(2,1)1.678W1(12e)1

Щільності для експоненціальної (1) та гамма (2,1), що показують медіани для обох;  зрозуміло, що медіана для експоненціалу (1) менша за половину, ніж для гамми (2,1)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.