Емпіричний CDF проти CDF


21

Я дізнаюся про емпіричну функцію кумулятивного розподілу. Але я все одно не розумію

  1. Чому його називають "емпіричним"?

  2. Чи є різниця між емпіричним CDF та CDF?



Існує просте, просте, елегантне пояснення щодо квитків у моделях коробки : CDF описує, що є в оригінальній коробці. ECDF - це те, що ви отримуєте, коли поміщаєте зразок (який представляє собою набір квитків, витягнутих з оригінальної скриньки: так звані "емпіричні" дані) у порожнє поле.
whuber

Потрібно пам’ятати, що ваш емпіричний розподіл зазвичай обмежений способом його побудови, тоді як CDF може не бути. Наприклад, якщо ви будуєте емпіричний CDF з спостережень за змінною Пуассона, отриманий ECDF буде обмежений найвищою частотою спостереження, тоді як справжній CDF не обмежений.
Аксакал

Відповіді:


27

Нехай - випадкова величина.X

  • Функція кумулятивного розподілу дає .F(x)P(Xx)
  • Емпірична функція кумулятивного розподілу дає на основі спостережень у вашій вибірці.G(x)P(Xx)

Відмінність полягає в тому, який показник ймовірності використовується. Для емпіричного CDF ви використовуєте міру ймовірності, визначену підрахунками частоти в емпіричній вибірці.

Простий приклад (фліп монети):

Нехай - випадкова величина, що позначає результат одного перевертання монети, де позначає голівки, а - хвости.XX=1X=0

CDF за справедливу монету надається:

F(x)={0for x<012for 0x<11for 1x

Якщо ви перевернули 2 голови та 1 хвіст, емпіричним CDF буде:

G(x)={0for x<023for 0x<11for 1x

Емпіричний CDF відображає, що у вашому зразку ваших фліп були головами.2/3

Інший приклад ( - CDF для нормального розподілу):F

Нехай - нормально розподілена випадкова величина із середнім значенням та стандартним відхиленням .X01

CDF надається:

F(x)=x12πex22

Скажімо, у вас було 3 розіграші IID та отримано значення . Емпіричним CDF буде: x1<x2<x3

G(y)={0for y<x113for x1y<x223for x2y<x31for x3y

При достатньому розіграші IID (і певні умови регулярності виконуються), емпіричний CDF буде конвергуватися на базовий CDF населення.


12

Чи є різниця між емпіричним CDF та CDF?

Так, вони різні. Емпіричний cdf є належним cdf, але емпіричний cdfs завжди буде дискретним, навіть якщо він не виведений з дискретного розподілу, тоді як cdf дистрибутива може бути іншими речами, крім дискретних.

Якщо ви ставитеся до вибірки так, ніби це сукупність значень, кожне з яких однаково вірогідне (тобто розміщення ймовірності 1 / n на кожному спостереженні), то cdf цього розподілу буде ECDF даних.

Чому його називають "емпіричним"?

Це оцінка cdf кількості населення на основі вибірки; конкретно, якщо ви ставитеся до пропорцій вибірки за кожним окремим значенням даних і трактуєте її так, як це було ймовірністю для популяції, ви отримуєте ECDF.

Емпіричне значення має щось на кшталт "спостереження, а не теорія", і саме це означає в даному випадку ... використовуючи спостереження для визначення функції розподілу.


10

Емпіричний CDF побудований з фактичного набору даних (на графіку нижче я використав 100 зразків зі стандартного нормального розподілу). CDF - теоретична конструкція - це те, що ви побачили, якби ви могли взяти нескінченно багато зразків.

Емпіричний CDF зазвичай наближає CDF досить добре, особливо для великих зразків (насправді, є теореми про те, як швидко він переходить до CDF зі збільшенням розміру вибірки).

Емпіричний CDF проти CDF


10

Емпіричне - це щось, що ви будуєте з даних та спостережень. Наприклад, припустимо, ви хочете знати про розподіл росту людей у ​​країні. Ви починаєте з вимірювання людей і придумуєте гістограму, яку можна наблизити до розподілу. Тоді ви обчислюєте емпіричний CDF.

Якщо ви використовуєте статистичний розподіл (детерміновану формулу, яка дає точно такий же вихід з тими ж параметрами), ви можете також обчислити його CDF.

N(μ=1.75 m,σ=0.1 m)


Чи є використане вимірювання довіри, яке виражає ймовірність того, що CDF та Emperical CDF описують одну і ту ж сукупність в межах всіх експериментальних вибірок у світі? Здається, це має, наприклад, заявку на виборчі опитування. (хоча, можливо, ні, оскільки вихід не є чітко описаним як функція ...)
BenPen

3

За даними Dictionary.com , визначення "емпіричного" включають:

отримані з досвіду чи експерименту або керуються ними

Отже, емпіричний CDF - це CDF, який ви отримуєте зі своїх даних. Це контрастує з теоретичним CDF (часто його називають "CDF"), який отримують із статистичної або ймовірнісної моделі, такої як нормальний розподіл.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.