У статистиці іноді корисно знати, чи походять два зразки даних з одного базового розподілу. Один із способів зробити це - скористатися двопробним тестом Колмогорова-Смірнова .
Ваше завдання полягатиме в тому, щоб написати програму, яка читає у двох несортованих невід'ємних цілих масивах та обчислює основну статистику, використану в тесті.
Дано масив A
і реальне число x
, визначте функцію розподілу F
за
F(A,x) = (#number of elements in A less than or equal to x)/(#number of elements in A)
Дано два масиви A1
і A2
, визнач
D(x) = |F(A1, x) - F(A2, x)|
Дві зразки статистики Колмогорова-Смірнова є максимальним значенням D
над усім реальним x
.
Приклад
A1 = [1, 2, 1, 4, 3, 6]
A2 = [3, 4, 5, 4]
Потім:
D(1) = |2/6 - 0| = 1/3
D(2) = |3/6 - 0| = 1/2
D(3) = |4/6 - 1/4| = 5/12
D(4) = |5/6 - 3/4| = 1/12
D(5) = |5/6 - 4/4| = 1/6
D(6) = |6/6 - 4/4| = 0
Статистика KS для двох масивів - 1/2
максимальне значення D
.
Тестові справи
[0] [0] -> 0.0
[0] [1] -> 1.0
[1, 2, 3, 4, 5] [2, 3, 4, 5, 6] -> 0.2
[3, 3, 3, 3, 3] [5, 4, 3, 2, 1] -> 0.4
[1, 2, 1, 4, 3, 6] [3, 4, 5, 4] -> 0.5
[8, 9, 9, 5, 5, 0, 3] [4, 9, 0, 5, 5, 0, 4, 6, 9, 10, 4, 0, 9] -> 0.175824
[2, 10, 10, 10, 1, 6, 7, 2, 10, 4, 7] [7, 7, 9, 9, 6, 6, 5, 2, 7, 2, 8] -> 0.363636
Правила
- Ви можете написати функцію або повну програму. Введення може бути через аргумент STDIN або аргумент функції, а вихід може бути через STDOUT або повернути значення.
- Ви можете припустити будь-який однозначний список або формат рядка для введення, якщо він відповідає обом масивам
- Якщо ви не маєте шансів, що ваша мова має для цього вбудований, ви можете не використовувати її.
- Відповіді повинні бути правильними принаймні до 3 значущих цифр
- Це код-гольф , тому програма виграє в найменших байтах
A
нижче length(A)
?)