Чи можна використовувати Колмогорова-Смірнова для порівняння двох емпіричних розподілів?

Чи правильно використовувати тест на корисність Колмогорова-Смірнова для порівняння двох емпіричних розподілів, щоб визначити, чи є вони з одного і того ж базового розподілу, а не для порівняння одного емпіричного розподілу із заздалегідь заданим опорним розподілом?

Дозвольте спробувати задати це іншим способом. Я збираю N проб з деякого розповсюдження в одному місці. Я збираю М проби в іншому місці. Дані є безперервними (скажімо, кожен зразок - це дійсне число між 0 і 10), але зазвичай не розподіляються. Я хочу перевірити, чи всі ці зразки N + M походять з одного базового розподілу. Чи доцільно використовувати для цього тест Колмогорова-Смірнова?

Зокрема, я міг обчислити емпіричний розподіл з вибірок, а емпіричний розподіл з зразків. Тоді я міг обчислити статистику тесту Колмогорова-Смірнова для вимірювання відстані між та : тобто обчислити, і використовуйте як мою статистику тесту, як і для тесту Колмогорова-Смірнова на корисність. Це розумний підхід? $F_0$ $N$ $F_1$ $M$ $F_0$ $F_1$ $D = \sup_x |F_0(x) - F_1(x)|$ $D$

(Я читав в іншому місці, що тест Колмогорова-Смірнова на придатність придатності не є дійсним для дискретних розподілів , але я визнаю, що не розумію, що це означає або чому це може бути правдою. Це означає, що запропонований нами підхід є поганим? )

Або ви замість цього рекомендуєте щось інше?

hypothesis-testing distributions kolmogorov-smirnov

— DW
джерело

Цікаво, чи не грунтуючись на коментарях @ Glen_b тут ( stats.stackexchange.com/questions/362/… ), не слід використовувати тест KS для порівняння емпіричних розподілів, оскільки тест KS не повинен використовуватися при оцінці параметрів (? ).

— russellpierce

Це нормально, і цілком розумно. Це називається двопробним тестом Колмогорова-Смірнова . Вимірювати різницю між двома функціями розподілу за супнормою завжди розумно, але для того, щоб зробити офіційний тест, ви хочете знати розподіл за гіпотезою, що два зразки є незалежними та кожен iid від одного і того ж базового розподілу. Щоб спиратися на звичайну асимптотичну теорію, вам знадобиться безперервність основного спільного розподілу (а не емпіричних розподілів). Для отримання більш детальної інформації див. Сторінку Вікіпедії, пов'язану вище.

ks.test $p$

— NRH
джерело

У R ви також можете виконати завантажуваний тест на KS sekhon.berkeley.edu/matching/ks.boot.html, який позбавляється від вимоги щодо безперервності

— д-р G

більше інформації, якщо ви використовуєте Matlab

— Артем Казнатчеєв