Відповіді:
Як вказував Стійн, тест ks повертає D-статистику і p-значення, відповідні D статистиці. D статистика - це абсолютна максимальна відстань (супремум) між CDF двох зразків. Чим ближче це число до 0, тим більше шансів на те, що два зразки були взяті з одного розподілу. Перегляньте сторінку Wikipedia для ks тесту. Це дає гарне пояснення: https://en.m.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test
Р-значення, повернене тестом ks, має таку ж інтерпретацію, як і інші p-значення. Ви відкидаєте нульову гіпотезу, що два зразки були взяті з одного і того ж розподілу, якщо значення p менше, ніж ваш рівень значущості. Ви можете знайти таблиці в Інтернеті для перетворення статистики D в p-значення, якщо вас цікавить процедура.
Під час пошуку в Google для ks_2samp, першим зверненням є цей веб-сайт. На ньому ви можете побачити специфікацію функції:
This is a two-sided test for the null hypothesis that 2 independent samples are drawn from the same continuous distribution.
Parameters :
a, b : sequence of 1-D ndarrays
two arrays of sample observations assumed to be drawn from a continuous distribution, sample sizes can be different
Returns :
D : float, KS statistic
p-value : float, two-tailed p-value