Чи правильно використовувати тест на корисність Колмогорова-Смірнова для порівняння двох емпіричних розподілів, щоб визначити, чи є вони з одного і того ж базового розподілу, а не для порівняння одного емпіричного розподілу із заздалегідь заданим опорним розподілом?
Дозвольте спробувати задати це іншим способом. Я збираю N проб з деякого розповсюдження в одному місці. Я збираю М проби в іншому місці. Дані є безперервними (скажімо, кожен зразок - це дійсне число між 0 і 10), але зазвичай не розподіляються. Я хочу перевірити, чи всі ці зразки N + M походять з одного базового розподілу. Чи доцільно використовувати для цього тест Колмогорова-Смірнова?
Зокрема, я міг обчислити емпіричний розподіл з вибірок, а емпіричний розподіл з зразків. Тоді я міг обчислити статистику тесту Колмогорова-Смірнова для вимірювання відстані між та : тобто обчислити, і використовуйте D як мою статистику тесту, як і для тесту Колмогорова-Смірнова на корисність. Це розумний підхід?
(Я читав в іншому місці, що тест Колмогорова-Смірнова на придатність придатності не є дійсним для дискретних розподілів , але я визнаю, що не розумію, що це означає або чому це може бути правдою. Це означає, що запропонований нами підхід є поганим? )
Або ви замість цього рекомендуєте щось інше?