Тести, що порівнюють розподіли, - це тести, що виключаються. Вони починаються з нульової гіпотези про те, що 2 групи однакові, потім намагаються відкинути цю гіпотезу. Ми ніколи не можемо довести нуль як правдивий, просто відкинути його, тому ці тести реально не можуть бути використані для того, щоб показати, що 2 зразки походять з однієї сукупності (або однакової сукупності).
Це тому, що в розподілах можуть бути незначні відмінності (тобто вони не тотожні), але настільки малі, що тести дійсно не можуть знайти різницю.
Розглянемо 2 розподіли, перший - рівномірний від 0 до 1, другий - суміш 2 уніформи, тож це 1 від 0 до 0,999, а також 1 між 9,999 та 10 (0 в інших місцях). Тож чітко ці розподіли різні (чи є різниця значущою - інше питання), але якщо взяти вибірку розміром 50 з кожного (всього 100), існує більше 90% шансів, що ви побачите лише значення між 0 і 0,999 і не зможете побачити будь-якої реальної різниці.
Є способи зробити те, що називається тестуванням на еквівалентність, коли ви запитуєте, чи 2 розподіли / сукупності еквівалентні, але вам потрібно визначити, що ви вважаєте еквівалентним. Зазвичай деяка міра різниці знаходиться в заданому діапазоні, тобто різниця у 2-х засобах становить менше 5% від середнього показника 2-х засобів, або статистика KS нижче зазначеної межі та ін. Якщо ви потім можна обчислити довірчий інтервал для різниці статистики (різниця засобів може бути просто t довірчим інтервалом, завантаження, моделювання чи інші методи можуть знадобитися для іншої статистики). Якщо весь довірчий інтервал потрапляє в "область еквівалентності", то ми вважаємо 2 групи / розподіли "еквівалентними".
Важка частина полягає у з'ясуванні, якою має бути область еквівалентності.