Скажімо, вам дано два багатовимірні набори даних, скажімо, старий та новий, і що вони, як передбачається, були створені тим самим процесом (для якого у вас немає моделі), але, можливо, десь уздовж лінії збирання / створення дані, щось пішло не так. Ви не хочете використовувати нові дані як, скажімо, набір перевірки для старих даних або додавати до старих даних.
Ви можете зробити купу 1-денної статистики (за змінну), наприклад, суму рейтингу Wilcoxon, і спробувати кілька разів виправити тест, але я не впевнений, що це оптимально (щоб зафіксувати тонкощі багатоваріантних даних, не кажучи вже про багатопробні питання). Один із способів - використовувати класифікатор і перевірити, чи можна розрізняти два набори даних (з огляду на оптимальний класифікатор, який є оптимальним). Це, здається, працює, але все-таки a) perhpas є кращим способом b) Це насправді не розроблено, щоб сказати вам, чому це інше (якщо нічого іншого, він використовуватиме найкращі прогнози і, можливо, пропустить інших хороших прогнозів, які були піддані кращим)