Що саме таке розподіл?


16

Я дуже мало знаю про ймовірність та статистику, і бажаю вчитися. Я бачу, що слово "розповсюдження" вживається в усьому світі в різних контекстах.

Наприклад, дискретна випадкова величина має "розподіл ймовірності". Я знаю, що це таке. Неперервна випадкова величина має функцію густини ймовірності, тоді для xR інтеграл від до x функції щільності ймовірності - це функція кумулятивного розподілу, що оцінюється на x .

І, мабуть, просто "функція розподілу" є синонімом "функції кумулятивного розподілу", принаймні, коли йдеться про безперервні випадкові змінні (питання: чи завжди вони є синонімами?).

Тоді є багато відомих дистрибуцій. розподіл χ 2 розподіл тощо. Що ж таке Γ розподіл? Це кумулятивна функція розподілу Γ випадкової величини? Або функція щільності ймовірності Γ випадкової величини?Γχ2ΓΓΓ

Але тоді розподіл частоти кінцевого набору даних виявляється гістограмою.

Короткий огляд: у вірогідності та статистиці, яке визначення слова "розподіл"?

Я знаю визначення розподілу в математиці (елемент подвійного простору колекції тестових функцій, оснащений індуктивною граничною топологією), але не ймовірність та статистика.


1
Відповідна стаття у Вікіпедії здається гідним вступом до теми.
Олександр Блех

1
Суворо, "розподіл" і "cdf" слід розглядати як синоніми, але "розподіл" часто використовується в набагато слабкішому сенсі і часто використовується для посилання на щільність / pmf.
Glen_b -Встановіть Моніку

3
Ваше розуміння розподілу досить близьке до ймовірного; головна відмінність полягає в тому, що ті, що ймовірно, користуються деякими додатковими властивостями (бути позитивними та нормалізуватися до єдності). Зв'язок полягає в тому, що ваше визначення встановлює розподіл з точки зору пов'язаного оператора очікування. Існує також (серйозне) зловживання мовою, що переважає у статистиці, яка також називає параметризовану родину дистрибуцій "розподілом". Нарешті, будь-який кінцевий набір даних визначає розподіл, отриманий шляхом вибірки з нього, його "емпіричний розподіл".
качан

@whuber Це допомагає, зокрема, зловживанням мовою. Це було б як називати невизначений інтеграл функції ... функцією.
данзібр

Подібне запитання з хорошими відповідями: stats.stackexchange.com/questions/210403/…
kjetil b halvorsen

Відповіді:


7

Далі йдеться про значення випадкових змінних. Розширення на інші простори прямо вперед, якщо вас цікавить. Я б заперечував, що наступне трохи більш загальне визначення є більш інтуїтивним, ніж окремо з огляду на функції щільності, маси та кумулятивного розподілу.R

Я включаю в текст деякі математичні / імовірнісні терміни, щоб зробити його правильним. Якщо хтось не знайомий з цими термінами, інтуїція однаково добре сприймається просто думкою про "множини Бореля" як про "будь-який підмножина яку я можу придумати", а про випадкову змінну - числовий результат деякого експерименту з пов'язана ймовірність.R


Нехай - простір ймовірностей, а X ( ω )(Ω,F,P)X(ω) випадкова величина , на цьому просторі.R

Задана функція , де AQ(A):=P(ωΩ:X(ω)A)A є набором Бореля, називається розподіл .X

Словом, розподіл говорить вам (слабко кажучи) для будь-якого підмножини про ймовірність того, що X набуває значення в цьому наборі. Можна довести, що Q повністю визначається функцією F ( x ) : = P ( X x ) і навпаки. Для цього - і я пропускаю тут деталі - побудуйте міру на множинах Бореля, які призначають вірогідність F ( x ) всім наборам ( - , x )RXQF(x):=P(Xx)F(x)(,x) і стверджують, що ця кінцева міра узгоджується з на aQ система породження Бореля σ - алгебри.πσ

Якщо так трапляється, що можна записати як Q ( A ) = A f ( x ) d x, то f - функція щільності для Q, і ви можете бачити, хоча ця щільність не визначається однозначно (врахуйте зміни на безлічі нульової міри Лебега), то має сенс також говорити про ті , як розподіл X . Зазвичай, проте, ми називаємо це функція щільності ймовірності X .Q(A)Q(A)=Af(x)dxfQfXX

Аналогічно, якщо так трапляється, що можна записати як Q ( A ) = i A { , - 1 , 0 , 1 , ... } f ( i ) , то має сенс говорити про fQ(A)Q(A)=iA{,1,0,1,}f(i)f як розподіл хоча ми зазвичай називаємо це функцією маси ймовірностей.X

Таким чином, кожного разу, коли ви читаєте щось на кшталт " дотримується рівномірного розподілу на [ 0 , 1 ] ", це просто означає, що функція Q ( A ) , яка повідомляє вам про ймовірність того, що X приймає значення в певних множинах, характеризується функція щільності ймовірності f ( x ) = I [ 0 , 1 ] або функція кумулятивного розподілу F ( x ) = x - X[0,1]Q(A)Xf(x)=I[0,1] .F(x)=xf(t)dt

Заключна примітка про випадок, коли не згадується випадкова величина, а лише розподіл. Можна довести, що з урахуванням функції розподілу (або маси, густини чи функції кумулятивного розподілу) існує простір ймовірностей із випадковою змінною, яка має це розподіл. Таким чином, по суті немає різниці в тому, щоб говорити про розподіл або про випадкову змінну, яка має такий розподіл. Це лише питання зосередженості.


3

Нехай - простір ймовірностей, нехай ( X , B ) - вимірюваний простір, а X : Ω X - вимірювана функція, що означає, що X - 1 ( B ) = { ω : X ( ω ) B } F для будь-якого B B . Розподіл X є імовірнісна міра μ(Ω,F,P)(X,B)X:ΩXX1(B)={ω:X(ω)B}FBB X над ( XμX визначається μ X ( B ) = P ( X B ) . Коли X = R і B - сигма-поле Бореля, ми називаємо функцію X випадковою "змінною".(X,B)μX(B)=P(XB)X=RBX


1
повинні бути дуже зрозумілі людям, які мають малознайомчі ймовірності та статистику :)
Олексій Григорьов

3
Що ж, ОП, здається, знає передові математичні речі, такі як "елемент подвійного простору колекції тестових функцій, оснащений індуктивною граничною топологією". Перевірте кінець його питання.
Дзен

2
Це справді була гарною реакцією для мене. Мені потрібно було перевірити визначення простору ймовірностей, але для людини з математичним фоном це було зрозуміло. Я високо оцінив стислість відповіді, лише не прийнявши її через деталізацію в іншій відповіді.
danzibr

1

На сьогодні питання та відповіді, як видно, були зосереджені на теоретичних розподілах. Емпіричні розподіли забезпечують більш інтуїтивне розуміння розподілів.

Приклад

Під час класного турніру зі скакалки ми спостерігаємо за всіма дітьми, які перебувають у скакалці класу. Перший малюк вміє стрибати двічі, другий чотири рази, наступний п’ятнадцять разів і т. Д. Записуємо кількість стрибків. П’ятеро дітей стрибали вісім разів кожен, але лише один із дітей стрибав двічі. Ми говоримо, що стрибки у вісім разів по-різному розподіляються, ніж стрибки двічі.

Ознаковим визначенням спостережуваного розподілу є частота зустрічань для кожного спостережуваного значення змінної.

Тоді в інфекційній статистиці ми намагаємось пристосувати теоретичні розподіли до спостережуваних розподілів, тому що ми хотіли б працювати з припущеннями теоретичних розподілів. До теоретичних розподілів можна дійти аналогічного визначення, замінивши "спостережуване" на "спостережливе" або якщо бути точнішим: "очікуване".

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.