Пара підходів:
Використовуйте парні значення p, але відрегулюйте їх для декількох порівнянь, використовуючи щось на зразок Bon Feroni або False Discovery Rate Ratemetnes (перше, мабуть, буде трохи над консервативним). Тоді ви можете бути впевнені, що будь-які, які все ще значно відрізняються, ймовірно, не пов'язані з багаторазовим тестуванням.
Ви можете створити загальний тест на смак KS, знайшовши найбільшу відстань між будь-яким з розподілів, тобто побудуйте всі емпіричні файли PDF і знайдіть найбільшу відстань від найнижчої до найвищої лінії, а може бути, середня відстань чи якесь інше значення міра. Тоді ви можете дізнатися, чи це важливо, зробивши тест на перестановку: згрупуйте всі дані в 1 велику скриньку, а потім випадковим чином поділіть їх на групи з тими ж розмірами вибірки, що і ваші вихідні групи, перерахуйте статистику на перестановлені дані та повторіть процес багато разів (999 або близько того). Потім подивіться, як ваші вихідні дані порівнюються з перестановленими наборами даних. Якщо вихідна статистика даних потрапляє в середину перестановлених, то значущих відмінностей не знайдено, але якщо вона знаходиться на межі, або поза будь-яким із перестановлених, то відбувається щось істотне (але це не говорить вам про різні). Вам, мабуть, слід спробувати це з імітованими даними, де ви знаєте, що різниця є достатньо великою, щоб бути цікавою лише для того, щоб перевірити силу цього тесту, щоб знайти цікаві відмінності.