Відмінності між статистичною моделлю та моделлю ймовірності?


29

Прикладна ймовірність є важливою галуззю ймовірності, включаючи обчислювальну ймовірність. Оскільки статистика використовує теорію ймовірностей для побудови моделей для обробки даних, як я розумію, мені цікаво, в чому суттєва різниця між статистичною моделлю та моделлю ймовірності? Модель імовірності не потребує реальних даних? Спасибі.

Відповіді:


29

Імовірнісна модель складається з триплету (Ω,F,P) , де Ω є вибіркове простір, F є σ - алгебра (події) і P є ймовірнісної мірою на F .

Інтуїтивне пояснення . Модель ймовірності може бути інтерпретована як відома випадковою величиною X . Наприклад, нехай X є нормально розподіленою випадковою величиною із середнім значенням 0 та дисперсією 1 . У цьому випадку міра ймовірності P пов'язана з функцією кумулятивного розподілу (CDF) F наскрізь

F(x)=P(Xx)=P(ωΩ:X(ω)x)=x12πexp(t22)dt.

Узагальнення . Визначення моделі ймовірності залежить від математичного визначення ймовірності, див., Наприклад, Вільна ймовірність та Квантова ймовірність .

Статистична модель являє собою набір імовірнісних моделей, це, безліч імовірнісних заходів / розподілів на вибірковому просторі Q ,SΩ .

Цей набір розподілів ймовірностей зазвичай вибирається для моделювання певного явища, з якого ми маємо дані.

Інтуїтивне пояснення . У статистичній моделі параметри та розподіл, які описують певне явище, невідомі. Прикладом цього є знайомство нормальних розподілів із середнім та дисперсією σ 2R + , це обидва параметри невідомі, і ти зазвичай хочеш використовувати набір даних для оцінки параметрів (тобто вибір елемента S ). Цей набір розподілів можна вибирати на будь-яких Ω і F , але, якщо я не помиляюся, у реальному прикладі є лише ті, що визначені для однієї пари ( Ω , F )μRσ2R+SΩF(Ω,F) розумно розглянути.

Узагальнення . Цей документ дає дуже формальне визначення Статистичної моделі, але автор зазначає, що "Байєсова модель вимагає додаткового компонента у формі попереднього розподілу ... Хоча байєсівські формулювання не є основним напрямком цієї роботи". Тому визначення статистичної моделі залежать від типу моделі, яку ми використовуємо: параметричної чи непараметричної. Також у параметричних параметрах визначення залежить від того, як обробляються параметри (наприклад, Класичний проти Байесівського).

Різниця є: в ймовірнісної моделі ви точно знаєте , вірогідну міру, наприклад , де μ 0 , σ 2 0 відомі параметри, в той час як в статистичної моделі розглядається безліч розподілів. , наприклад Нормальний ( μ , σ 2 ) , де μ , σ 2Normal(μ0,σ02)μ0,σ02Normal(μ,σ2)μ,σ2 - невідомі параметри.

Жоден з них не потребує набору даних, але я б сказав, що для моделювання зазвичай вибирають Статистичну модель.


2
@HonglangWang В певній мірі це правильно. Основна відмінність полягає в тому, що модель ймовірності - це лише один (відомий) розподіл, тоді як статистична модель - це сукупність імовірнісних моделей; дані використовуються для вибору моделі з цього набору або меншої підмножини моделей, які краще (в певному сенсі) описують явище (з урахуванням даних).

2
(+1) Це хороша відповідь, хоча у мене є кілька коментарів. По-перше, я думаю, що це, можливо, продає ймовірність трохи коротше. Зовсім не рідко розглядати набір імовірнісних просторів у імовірнісній моделі, і дійсно можливі заходи можуть бути навіть випадковими (побудованими на відповідно великому просторі). По-друге, баєсівський (зокрема) міг би вважати цю відповідь дещо невтішною, оскільки баєсовська статистична модель часто може розглядатися як єдина імовірнісна модель на відповідному просторі продуктів . Ω×Θ
кардинал

1
@gung Це питання, більш пов'язане з теорією мір. Що стосується вашого першого питання, дійсно визначається через CDF. Тепер інтерпретація Ω є складною, оскільки формально P ( X x ) означає P ( ω Ω : X ( ω ) x ) , тоді Ω не є спостережуваними значеннями. F є σ - алгебра , яка є прообразом Бореля сг - алгебра під XPΩP(Xx)P(ωΩ:X(ω)x)ΩFσσX, знову це не спостерігається. Я не впевнений, як це пояснити на інтуїтивному рівні.

2
@ gung залежить від програми ; це не визначається теорією. Наприклад, Ω може бути набором броунівських рухів, що описують ціну фінансової деривативи, а X може бути значенням, досягнутим за фіксований час t . В іншому застосуванні Ω може бути набором людей, а X може бути довжиною їх передпліч. Як правило, Ω - математична модель фізичних об'єктів дослідження, а X - числова властивість цих об'єктів. F - це сукупність можливих подій: ті ситуації, до яких ми хочемо віднести ймовірності.ΩΩXtΩXΩXF
whuber

2
@gung - алгебра сигми : це сукупність підмножин ("події"). У фінансовому застосуванні це сукупність історій цін; у застосуванні для вимірювання передпліччя події будуть набором людей. Ми можемо поговорити про це більше, якщо хочете в чаті. F
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.