Чи робить Вольфрам Mathworld помилку, описуючи дискретний розподіл ймовірностей з функцією густини ймовірностей?


14

Зазвичай розподіл ймовірності на дискретні змінні описується за допомогою функції масової ймовірності (PMF):

Працюючи з безперервними випадковими змінними, ми описуємо розподіли ймовірностей за допомогою функції щільності ймовірностей (PDF), а не функції масової ймовірності.

- Глибоке навчання Гудффелла, Бенджо та Курвіля

Однак Wolfram Mathworld використовує PDF для опису розподілу ймовірностей по дискретних змінних:

введіть тут опис зображення

Це помилка? чи це не має великого значення?


5
На мою думку, це неохайно, але не дуже важливо. Це навіть можна захистити, якщо вони наближаються до ймовірності з точки зору теорії вимірювань, хоча це здається трохи вступом до гортання монети. (Як не дивно, у них, здається, немає статті про PMF.)
Дейв,

9
pmf - це щільність проти міри підрахунку
Сіань

3
Коли ви обговорюєте теорію ймовірностей на рівні простору вимірювання, визначеному 3 елементами, pdf та pmf не відрізняються, тому pmf падає. Усі дистрибутиви можуть бути визначені у форматі PDF. wolfram - це математичний веб-сайт, тому не дивно, що вони використовують математику високого рівня, щоб говорити про ймовірність. Ось хороше вільне читання. stat.washington.edu/~pdhoff/courses/581/LectureNotes/…
користувач158565

Відповіді:


30

Це не помилка: при формальному трактуванні ймовірності за допомогою теорії вимірювань функція густини ймовірності є похідною від міри ймовірності інтересу, взятої стосовно "домінуючої міри" (її також називають "еталонною мірою"). Для дискретних розподілів на цілі числа функція маси ймовірностей є функцією густини відносно міри підрахунку . Оскільки функція маси ймовірностей є певним типом функції щільності ймовірності, іноді ви знайдете такі посилання, які посилаються на неї як на функцію щільності, і вони неправильно посилаються на неї таким чином.

У звичайному дискурсі щодо ймовірності та статистики часто уникають цієї термінології та проводять розмежування між "функціями маси" (для дискретних випадкових змінних) та "функціями щільності" (для безперервних випадкових величин), щоб розрізнити дискретні та безперервні розподіли. В інших контекстах, де можна констатувати цілісні аспекти вірогідності, часто краще ігнорувати відмінність і називати їх як "функції щільності".


Дякую за вашу відповідь. Чи означає treatment"формальне трактування ймовірності" позначення, перспектива, конвенція чи щось інше?
czlsws

Коли я говорю тут про "формальне поводження", я маю на увазі сучасну основу теорії ймовірностей, яка є підмножиною теорії мір. Це математична теорія, яка приймається як формальне підґрунтя ймовірності.
Моніку

"функція щільності ймовірності є похідною від міри ймовірності, яка цікавить". Мені здається, що в деякому сенсі це більше "антиінтеграл", ніж похідна. Існують розривні PDF-файли, такі як рівномірний розподіл, і дискретні розподіли можна розглядати як суму дельта-функцій Дірака. У цих випадках доведеться узагальнити поняття похідної, що значно перевищує звичайне розуміння, щоб воно застосовувалося.
Накопичення

@ Накопичення - як припиняється рівномірний розподіл? ... і теорія вимірювань є набагато більш загальним трактуванням інтеграції та диференціації, ніж звичайне розуміння Кальків I та II.
jbowman

@ Накопичення: Так, це справедлива характеристика, і справді саме так робиться. Технічно щільність є похідною Радона-Нікодима , яка справді є типом "антиінтеграла" типу, який ви описуєте.
Моніку

5

Окрім більш теоретичної відповіді з точки зору теорії вимірювань, також зручно не розрізняти pmfs та pdfs у статистичному програмуванні. Наприклад, R має безліч вбудованих розподілів. Для кожного розподілу він має 4 функції. Наприклад, для звичайного розподілу (з файлу довідки):

dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.

Користувачі R швидко починають використовувати d,p,q,rпрефікси. Буде прикро, якби вам довелося зробити щось на зразок краплі dта використання, mнаприклад, біноміального розподілу. Натомість все, як очікував користувач R:

dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.

3
scipy.statsрозрізняє, деякі об’єкти мають pdfметод, а інші - pmfметод. Це мене справді дратує!
Меттью Друрі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.