Існує концепція, спеціально для порівняння розподілів, яка повинна бути краще відома: відносний розподіл.
Y0, YЖ0, FЖ0
R = F0( Y)
RYY0Ж0( Y0) завжди має рівномірний розподіл (з безперервними випадковими змінними, якщо випадкові величини дискретні, це буде приблизним).
Розглянемо приклад. На веб-сайті http://www.math.hope.edu/swanson/data/cellphone.txt наведено дані про тривалість останнього телефонного дзвінка студентів та жінок. Висловимо розподіл довжини телефонних дзвінків для студентів-чоловіків, серед жінок - студентів.
хТ (що б воно не було, його значення не показано) таким, що на 20% жіночих дзвінків було коротше (або рівне) до цього відносна щільність для чоловіків у цьому інтервалі коливається приблизно від 1,3 до 1,4. Якщо ми зблизимо (подумки з графіку) середню відносну щільність у цьому інтервалі як 1,35, ми побачимо, що частка чоловіків у цьому інтервалі приблизно на 35% більша, ніж частка жінок. Це відповідає 27% чоловіків у цей інтервал.
Ми також можемо зробити той же графік з точковими інтервалами довіри навколо кривої відносної щільності:
Широкі діапазони довіри в цьому випадку відображають невеликий розмір вибірки.
Існує книга про цей метод: Handcock
Код R для сюжету знаходиться тут:
phone <- read.table(file="phone.txt", header=TRUE)
library(reldist)
men <- phone[, 1]
women <- phone[, 3]
reldist(men, women)
title("length of mens last phonecall with women as reference")
Для останньої зміни сюжету на:
reldist(men, women, ci=TRUE)
title("length of mens last phonecall with women as reference\nwith pointwise confidence interval (95%)")
Зауважимо, що графіки виробляються з використанням оцінки щільності ядра зі ступенем гладкості, обраної за допомогою gcv (узагальнена перехресна перевірка).
Q0Ж0rRуr
г( r ) = f( Q0( r ) )f0( Q0( r ) )
або за вихідною шкалою вимірювання як
г( r ) = f( уr)f0( уr). Це показує, що відносну щільність можна інтерпретувати як відношення щільності. Але, у першій формі, з аргументом
r, це також сама по собі щільність, що інтегрується до одиниці протягом інтервалу
( 0 , 1 ). Це робить його гарною відправною точкою для висновку.
hist
; згладжена щільністьdensity
,; QQ-сюжетиqqplot
; стеблосто-листяні ділянки (трохи старовинні)stem
. Крім того, тест Колмогорова-Смірнова може бути хорошим доповненнямks.test
.