Чи містять однакову інформацію у форматі pdf та pmf та cdf?


17

Чи містять однакову інформацію у форматі pdf та pmf та cdf?

Для мене pdf дає усю вірогідність певній точці (в основному області під ймовірністю).

Pmf дають ймовірність певної точки.

У cdf наведено ймовірність під певним моментом.

Тож у мене pdf та cdf мають однакову інформацію, але у pmf немає, тому що це дає ймовірність точки xщодо розподілу.

Відповіді:


25

Якщо робиться відмінність між функцією ймовірності та щільністю *, pmf застосовується лише до дискретних випадкових змінних, тоді як pdf застосовується до безперервних випадкових змінних.

* формальні підходи можуть охоплювати обидва і використовувати для них єдиний термін

Cdf застосовується до будь-яких випадкових змінних, включаючи тих, у яких немає ні pdf, ні pmf.

введіть тут опис зображення

( Змішаний розподіл - це не єдиний випадок розповсюдження, у якому немає pdf чи pmf, але це досить поширена ситуація - наприклад, врахуйте кількість дощу за день або суму грошей, сплачених у претензіях на поліс страхування майна, будь-який з яких може бути змодельований шляхом нульового надутого безперервного розподілу)

Cdf для випадкової величини дає P ( X x )ХП(Хх)

Pmf для дискретної випадкової величини дає P ( X = x ) .ХП(Х=х)

Сам pdf не дає ймовірностей , а відносних ймовірностей; безперервні розподіли не мають точкових імовірностей. Щоб отримати ймовірності від pdfs, вам потрібно інтегруватися через деякий інтервал - або взяти різницю у двох значеннях cdf.

Важко відповісти на питання "чи містять вони однакову інформацію", оскільки це залежить від того, що ви маєте на увазі. Ви можете переходити від pdf до cdf (через інтеграцію), і від pmf до cdf (через підсумовування), і від cdf до pdf (через диференціювання), і від cdf до pmf (шляхом розрізнення), так що якщо є pmf або pdf, він містить ту саму інформацію, що і cdf.


1
Глен, чи можете ви допомогти, надавши посилання, де я міг прочитати про "pdf, що дає відносні ймовірності"? Це дуже цікаво, і я не пам'ятаю, щоб це бачив у своїх книгах. Спасибі.
Алекос Пападопулос

@Alecos Це просто (можливо, погано сформульоване) пояснення того факту, що тоді як не є ймовірністю, оскільки f ( x )f(x) - ймовірність перебування в ( x , x + d x ) , тоді f (f(x)dx(x,x+dx) можна розглядати як відношення ймовірності того, що змінна з щільністю f знаходиться в дуже невеликій відстані x до відношення, що змінна з щільністю g знаходиться в одному інтервалі. У цьому сенсі він виражає "відносну ймовірність". f(x)/g(x)fxг
Glen_b -Встановити Моніку

Я бачу. Це, безумовно, справедливо як наближення співвідношення ймовірностей і, безумовно, присутнє в емпіричних функціях щільності, де речі дискретні за необхідністю.
Алекос Пападопулос

10

PMF асоціюються з дискретними випадковими змінними, PDF-файлами з безперервними випадковими змінними. Для будь-якого типу випадкової випадкової величини CDF завжди існує (і є унікальним), визначеним як Тепер, залежно від набору підтримки випадкової величини X , щільність (або функція маси) не повинна існувати. (Розглянемо набір кантора та функцію кантора. Набір рекурсивно визначається шляхом видалення центральної 1/3 одиничного інтервалу, потім повторення процедури інтервалів (0, 1/3) та (2/3, 1) тощо Функція визначається як C ( x

FX(x)=P{Xx}.
X , якщо x знаходиться в наборі Кантарів, а найбільша нижня межа в наборі канторів, якщо x не є членом.) Функція Кантатора - це ідеально хороша функція розподілу, якщо застосувати C ( x ) =C(x)=xxx якщо x < 0 і C ( x ) = 1, якщо 1 < x . Але цей cdf не має щільності: C ( x ) безперервно скрізь, але його похідна 0 майже скрізь. Без щільності стосовно будь-якого корисного заходу.C(x)=0x<0C(x)=11<xC(x)

Отже, відповідь на ваше запитання полягає в тому, що якщо функція густини або маси існує, то це похідне від CDF стосовно певної міри. У цьому сенсі вони несуть "ту саму" інформацію. АЛЕ PDF-файли та файли PMF не повинні існувати. CDF повинні існувати.


2
Деннісе, ти можеш уточнити, що ти маєш на увазі під фразою " Ніякої щільності стосовно будь-яких заходів "? Звичайно, вона має щільність (рівномірну!) Щодо себе.
кардинал

@cardinal: Я спробую, але не знаю, що це матиме сенс, якщо ви не вивчили реальний аналіз. Якщо ви подивитеся на старіші книги з математичної статистики (наприклад, Математична статистика Фрейнда ), ви побачите ПМП, які називаються "щільністю". Назва "щільність" обґрунтовується мірою ймовірності на вимірюваному просторі ( Ω , σ ( Ω ) , μ ), що лежить в основі CDF (див. Коментар Джоела). Щільність є похідною Радона-Нікодима мк по відношенню до деякої міри (зазвичай міра Лесбега або міра підрахунку). У цьому випадку C ( x )μ(Ω,σ(Ω),μ)μC(x)не має похідної RN.
Денніс

3
@cardinal (продовження): Міра ймовірності рівномірна на наборі Кантора, але це така дивна бістія, що я навіть не впевнений, як виглядає -алгебра. Можливо, я мав би сказати: "Немає щільності щодо будь-якого корисного заходу". σ
Денніс

2

Інші відповіді вказують на той факт, що CDF є основоположними і повинні існувати, тоді як PDF-файли та PMF не є і не обов'язково існують.

Це збентежило і заінтригувало мене (будучи нестатистичним), оскільки я не знав, як інтерпретувати CDF (або як він може існувати), коли пробний простір не був упорядкований; подумайте, наприклад, кола .S1

Мені здається, що відповідь полягає в тому, що основна функція - це міра ймовірності , яка відображає кожну (розглянутий) підмножину вибіркового простору на ймовірність. Потім, коли вони існують, CDF, PDF та PMF виникають із міри ймовірності.


1
Як я це бачив, більшість підручників визначають "випадкову змінну" як відображення від вибіркового простору до реальних чисел. По суті, "випадкова величина" є реальною оцінкою.
Ніл Г

1
Ми використовуємо випадкові величини, щоб потрапити в простір ймовірностей і подалі від ( Ω , σ ( Ω ) , μ ) . Ω може бути, а може бути і не впорядкованим, і це болісно боротися. Я гадаю, ви праві, що μ є більш фундаментальним: адже F X ( x ) = μ { ω(R,B,F)(Ω,σ(Ω),μ)Ωμ
FX(x)=μ{ω|X(ω)x}.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.