Чи є CDF більш фундаментальними, ніж PDF-файли?


43

Мій стат проф, в основному сказав, що якщо дати одне з наступних трьох, ви можете знайти інші два:

  • Функція накопичувального розподілу
  • Момент, що генерує функцію
  • Функція щільності ймовірності

Але мій професор економетрики сказав, що CDF є більш фундаментальними, ніж PDF-файли, оскільки є приклади, де можна мати CDF, але PDF не визначений.

Чи є CDF більш фундаментальними, ніж PDF-файли? Як я можу дізнатись, чи можна отримати PDF або MGF з CDF?


23
Це якийсь конкурс фундаментальності? У нас є колегія суддів знаменитостей? Усі ці три поняття можна використовувати для визначення міри на просторі . Однак для даного CDF MGF та PDF можуть не існувати, оскільки PDF визначається як похідне CDF, а MGF визначається як R exp ( t x ) d F ( x ) , і ця інтегральна потреба не існує. Однак це не означає, що будь-яке з цих понять є менш фундаментальним. Fundamental - приємний прикметник, який не має математичного визначення. Це синонім важливого. RdRexp(tx)dF(x)
mpiktas

6
@mpiktas: Кожен розподіл ймовірностей на (підмножині) має CDF, і він однозначно визначає розподіл. Однак, не всі розподіли ймовірностей мають PDF або MGF (але всі вони мають характерну функцію ). Rn
Ільмарі Каронен

3
@mpiktas Ви можете зробити це з на R . Тоді P ( ( - , x ] ) не визначено. Проте мені абсолютно зрозуміло, чому професор використав вираз "більш фундаментальний". Прикметник може не мати чітко визначеного математичного значення, але так що? Я говорю (деякі ) Англійська мова. Кожен PDF, який нам відомий, має основний CDF. Тут "underlying" має гарну асоціацію з "фундаментальною". Навпаки не вірноA={R,}RP((,x])
drhab

2
@drhab, природно, я говорив про похідну Радон-Нікодим :) Я занадто досконало розумію, що мав на увазі професор, але на мою думку небезпечно використовувати такі вирази зі студентами, бо тоді замість того, щоб намагатися зрозуміти різницю між Математичні концепції намагаються класифікувати їх за принципами, що є принципово неправильним. Каламбур призначений.
mpiktas

4
@mpiktas: звичайно, немає точного визначення поняття "фундаментальний". Але є велика середина між "суворо визначеними" та "абсолютно безглуздими". У самій нашій математиці, звичайно, все зрештою повинно бути цілком суворим, тому ми дуже звикли плескати все, що ні. Але коли ми говоримо і думаємо про математику, у нас є суб'єктивні, але значущі поняття, такі як "основні", "загальні" тощо, як і всі інші; і це нормально.
PLL

Відповіді:


69

Кожен розподіл ймовірностей на (підмножині) має кумулятивну функцію розподілу , і він однозначно визначає розподіл. Отже, в цьому сенсі CDF насправді настільки ж фундаментальний, як і сам розподіл.Rn

Однак функція щільності ймовірності існує лише для (абсолютно) постійних розподілів ймовірностей . Найпростішим прикладом розподілу, якому бракує PDF, є будь-який дискретний розподіл ймовірності , такий як розподіл випадкової величини, яка приймає лише цілі значення.

Звичайно, такі дискретні розподіли ймовірностей замість цього можуть характеризуватися функцією маси ймовірностей , але є також розподіли, у яких немає ні PDF, ні PMF, таких як будь-яка суміш безперервного та дискретного розподілу:

Діаграма безперервних, дискретних і змішаних розподілів ймовірностей
(Діаграма безсоромно викрадена з відповіді Glen_b на пов’язане питання.)

Існують навіть сингулярні розподіли ймовірностей , такі як розподіл Кантора , які неможливо описати навіть комбінацією PDF та PMF. Однак такі розподіли все ще мають чітко визначений CDF. Наприклад, ось CDF розповсюдження Кантора, який також іноді називають "Чортовою сходами":

Канторний розподіл CDF
( Зображення з Вікісховища користувачів Теона і Amirki , що використовується під CC-BY-SA 3.0 ліцензії.)

CDF, відомий як функція Кантора , є безперервним, але не абсолютно безперервним. Насправді він є постійним скрізь, за винятком набору Кантора з нульовою мірою Лебега, але який все ще містить нескінченно багато точок. Таким чином, вся маса ймовірностей розподілу Кантора зосереджена на цьому зникаючому малому підмножині прямої чисельної лінії, але кожна точка множини все одно окремо має нульову ймовірність.


Існують також розподіли ймовірностей, які не мають функції генерування моментів . Напевно, найвідоміший приклад - розподіл Коші , жировий розподіл, який не має чітко визначених моментів порядку 1 або вище (таким чином, зокрема, не має чітко визначеної середньої чи дисперсії!).

Rn


Ви говорите, що кожен дистрибутив має CDF, але не кожен має PDF, але насправді є дистрибутиви, які мають PDF-файли та не мають CDF-файлів закритої форми, наприклад, багатоваріантні нормальні.
Тім

13
@Tim: Це правда, але лише з класифікатором "закритої форми"; CDF все ще існує, навіть якщо ми не можемо записати його у закритому вигляді. І в будь-якому випадку, визначення " виразу закритої форми " є, як відомо, нечітким; за деякими суворими визначеннями, навіть однофакторний нормальний розподіл не має CDF закритої форми, але якщо ви вважаєте, що функція помилки є закритою формою, вона є.
Ільмарі Каронен

11
@Tim Це не зустрічний приклад. Це довільна властивість, яку ви вибрали як важливу / фундаментальну для вас. Для мене властивість "існує" важливіше, ніж "має закриту форму". Тим більше, що "завжди існує" проти "іноді може не мати закритої форми, як і будь-яка функція".
Арк-кун

3
[0,1]R

1
@ Ark-kun Я тут граю прихильників чортів, оскільки є випадки, коли PDF - це щось більше "безпосередньо доступне", ніж CDF. Мені подобається ця відповідь (+1), але ІМХО, це те, що також можна було б згадати.
Тім

16

Я вважаю, що ваш професор з економетрики щось думав у наступних напрямках.

F[0,1]

F(x)=12x for x<12
F(x)=12x+12 for x12

[0,1]

P({12})=12

f

f

За визначенням PDF, ми повинні мати

0xf(t)dt=F(x)F(0)=14x

0<x<12

f(x)=14 for x<12

x>12

f(x)=14 for x>12

ff(12)f(12)

P({12})=12

нам знадобиться

12ϵ12+ϵf(t)dt>12

12

12ϵ12+ϵf(t)dt=12ϵ12+ϵ14dt=12ϵ

f

Ви можете відновити дух PDF, але ви повинні використовувати більш складні математичні об'єкти, або міру, або розподіл .


3
12δ(x12)δ(x)x=0
+δ(x)dx=1

2
L1

@IwillnotexistIdonotexist Що сказав Whuber, це те, на що я натякав в останньому рядку. Я вжив слово "розподіл".
Меттью Друрі

4
1/21/2

4

Ілмарі дає хорошу відповідь з теоретичної точки зору. Однак можна також запитати, для яких цілей щільність (pdf) та функція розподілу (pdf) служать для практичних обчислень. Це могло б з’ясувати, для яких ситуацій одна безпосередньо корисна, ніж інша.

R(,x]

Однак щільність є важливою для статистики, оскільки ймовірність визначається з точки зору щільності. Таким чином, якщо ми хочемо обчислити максимальну оцінку ймовірності, нам безпосередньо потрібна щільність.

Якщо ми звернемось до порівняння емпіричного та теоретичного розподілу, обидва можуть бути корисними, але такі методи, як pp- та qq-графіки на основі функції розподілу, часто є переважними.

Rdd2

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.