Практично кожен джерело чи людина, з якою я коли-небудь спілкувався, крім джерела Wolfram, з яким ви пов’язали, відноситься до цього процесу як до пристосування моделі до даних . Це має сенс, оскільки модель є динамічним об'єктом, а дані є статичними (він же фіксований та постійний).
Якщо говорити про це, мені подобається підхід Ларрі Вассермана до цього. За його розповіддю, статистична модель - це сукупність розподілів. Наприклад, колекція всіх звичайних розподілів:
{ Нормальна ( μ , σ) : μ , σ∈ R , σ> 0 }
або набір усіх розподілів Пуассона:
{ Пуассон ( λ ) : λ ∈ R , λ > 0 }
Пристосування розподілу до даних - це будь-який алгоритм, який поєднує статистичну модель із набором даних (дані фіксовані) та вибирає саме один із розподілів із моделі як той, який «найкраще» відображає дані.
Модель - це те, що змінюється (свого роду): ми зводимо її з усієї колекції можливостей у єдиний найкращий вибір. Дані - це лише дані; з цим нічого не відбувається.