Подумайте над своїм твердженням як про частого лікаря та спершу зробіть його більш конкретним. Часто лікар не може сказати, що "набір даних A відрізняється від набору даних B" без будь-яких додаткових роз'яснень.
По-перше, вам доведеться зазначити, що ви маєте на увазі під "різними". Можливо, ви маєте на увазі "мають різні середні значення". Знову ж таки, ви можете сказати, що "мають різні відхилення". А може, щось інше?
Тоді вам доведеться вказати, який саме тест ви б використовували, що залежить від того, які ви вважаєте, чи є правильними припущення щодо даних. Ви припускаєте, що набори даних обидва зазвичай розподіляються приблизно щодо певних засобів? Або ти вважаєш, що вони обидва бета-версії? Або щось інше?
Тепер ви бачите, що друге рішення дуже схоже на пріорі в баєсівській статистиці? Це не просто "мій минулий досвід", а швидше те, в що я вірю, і те, в що я вірю моїм ровесникам, є обґрунтованими припущеннями щодо моїх даних. (І баєси можуть використовувати однакові пріори, що підштовхує речі до частотних розрахунків.)
EDIT: У відповідь на ваш коментар: наступний крок міститься в першому згаданому нами рішенні. Якщо ви хочете вирішити, чи відрізняються засоби двох груп, ви подивитесь на розподіл різниці засобів двох груп, щоб побачити, чи цей розподіл містить чи не містить нуля, на якомусь рівні впевненості. Наскільки саме близький до нуля ви зараховуєте до нуля і яку саме частину (задньої) дистрибуції ви використовуєте, визначаєте ви та рівень впевненості, який ви бажаєте.
Обговорення цих ідей можна знайти у статті Крушке , який також написав дуже читану книгу " Проведення Байєсівського аналізу даних" , яка висвітлює приклад на сторінках 307-309 "Чи рівні групи?". (Друге видання: стор. 468-472.) Він також публікує блог на цю тему , з деякими запитаннями та питаннями.
ДОПОМОГА редакція: Ваш опис байєсівського процесу також не зовсім коректний. Байєсів цікавить лише те, що нам дають дані, зважаючи на те, що ми знали, незалежно від даних. (Як зазначає Крушке, попереднє значення не обов'язково відбувається перед даними. Саме з цього випливає ця фраза, але насправді це лише наші знання, виключаючи деякі дані.) Те, що ми знали незалежно від певного набору даних, може бути розпливчастим або конкретним. і може базуватися на консенсусі, моделі основного процесу генерування даних або можуть бути просто результатами іншого (не обов'язково попереднього) експерименту.