Чи можна використовувати Колмогорова-Смірнова для порівняння двох емпіричних розподілів?


16

Чи правильно використовувати тест на корисність Колмогорова-Смірнова для порівняння двох емпіричних розподілів, щоб визначити, чи є вони з одного і того ж базового розподілу, а не для порівняння одного емпіричного розподілу із заздалегідь заданим опорним розподілом?

Дозвольте спробувати задати це іншим способом. Я збираю N проб з деякого розповсюдження в одному місці. Я збираю М проби в іншому місці. Дані є безперервними (скажімо, кожен зразок - це дійсне число між 0 і 10), але зазвичай не розподіляються. Я хочу перевірити, чи всі ці зразки N + M походять з одного базового розподілу. Чи доцільно використовувати для цього тест Колмогорова-Смірнова?

Зокрема, я міг обчислити емпіричний розподіл з вибірок, а емпіричний розподіл з зразків. Тоді я міг обчислити статистику тесту Колмогорова-Смірнова для вимірювання відстані між та : тобто обчислити, і використовуйте D як мою статистику тесту, як і для тесту Колмогорова-Смірнова на корисність. Це розумний підхід?F0NF1MF0F1D=supx|F0(x)F1(x)|D

(Я читав в іншому місці, що тест Колмогорова-Смірнова на придатність придатності не є дійсним для дискретних розподілів , але я визнаю, що не розумію, що це означає або чому це може бути правдою. Це означає, що запропонований нами підхід є поганим? )

Або ви замість цього рекомендуєте щось інше?


Цікаво, чи не грунтуючись на коментарях @ Glen_b тут ( stats.stackexchange.com/questions/362/… ), не слід використовувати тест KS для порівняння емпіричних розподілів, оскільки тест KS не повинен використовуватися при оцінці параметрів (? ).
russellpierce

Відповіді:


19

Це нормально, і цілком розумно. Це називається двопробним тестом Колмогорова-Смірнова . Вимірювати різницю між двома функціями розподілу за супнормою завжди розумно, але для того, щоб зробити офіційний тест, ви хочете знати розподіл за гіпотезою, що два зразки є незалежними та кожен iid від одного і того ж базового розподілу. Щоб спиратися на звичайну асимптотичну теорію, вам знадобиться безперервність основного спільного розподілу (а не емпіричних розподілів). Для отримання більш детальної інформації див. Сторінку Вікіпедії, пов'язану вище.

ks.testp


8
У R ви також можете виконати завантажуваний тест на KS sekhon.berkeley.edu/matching/ks.boot.html, який позбавляється від вимоги щодо безперервності
д-р G

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.