Імовірнісна модель складається з триплету (Ω,F,P) , де Ω є вибіркове простір, F є σ - алгебра (події) і P є ймовірнісної мірою на F .
Інтуїтивне пояснення . Модель ймовірності може бути інтерпретована як відома випадковою величиною X . Наприклад, нехай X є нормально розподіленою випадковою величиною із середнім значенням 0 та дисперсією 1 . У цьому випадку міра ймовірності P пов'язана з функцією кумулятивного розподілу (CDF) F наскрізь
F(x)=P(X≤x)=P(ω∈Ω:X(ω)≤x)=∫x−∞12π−−√exp(−t22)dt.
Узагальнення . Визначення моделі ймовірності залежить від математичного визначення ймовірності, див., Наприклад, Вільна ймовірність та Квантова ймовірність .
Статистична модель являє собою набір імовірнісних моделей, це, безліч імовірнісних заходів / розподілів на вибірковому просторі Q ,SΩ .
Цей набір розподілів ймовірностей зазвичай вибирається для моделювання певного явища, з якого ми маємо дані.
Інтуїтивне пояснення . У статистичній моделі параметри та розподіл, які описують певне явище, невідомі. Прикладом цього є знайомство нормальних розподілів із середнім та дисперсією σ 2 ∈ R + , це обидва параметри невідомі, і ти зазвичай хочеш використовувати набір даних для оцінки параметрів (тобто вибір елемента S ). Цей набір розподілів можна вибирати на будь-яких Ω і F , але, якщо я не помиляюся, у реальному прикладі є лише ті, що визначені для однієї пари ( Ω , F )μ∈Rσ2∈R+SΩF(Ω,F) розумно розглянути.
Узагальнення . Цей документ дає дуже формальне визначення Статистичної моделі, але автор зазначає, що "Байєсова модель вимагає додаткового компонента у формі попереднього розподілу ... Хоча байєсівські формулювання не є основним напрямком цієї роботи". Тому визначення статистичної моделі залежать від типу моделі, яку ми використовуємо: параметричної чи непараметричної. Також у параметричних параметрах визначення залежить від того, як обробляються параметри (наприклад, Класичний проти Байесівського).
Різниця є: в ймовірнісної моделі ви точно знаєте , вірогідну міру, наприклад , де μ 0 , σ 2 0 відомі параметри, в той час як в статистичної моделі розглядається безліч розподілів. , наприклад Нормальний ( μ , σ 2 ) , де μ , σ 2Normal(μ0,σ20)μ0,σ20Normal(μ,σ2)μ,σ2 - невідомі параметри.
Жоден з них не потребує набору даних, але я б сказав, що для моделювання зазвичай вибирають Статистичну модель.