Я дізнаюся про емпіричну функцію кумулятивного розподілу. Але я все одно не розумію
Чому його називають "емпіричним"?
Чи є різниця між емпіричним CDF та CDF?
Я дізнаюся про емпіричну функцію кумулятивного розподілу. Але я все одно не розумію
Чому його називають "емпіричним"?
Чи є різниця між емпіричним CDF та CDF?
Відповіді:
Нехай - випадкова величина.
Відмінність полягає в тому, який показник ймовірності використовується. Для емпіричного CDF ви використовуєте міру ймовірності, визначену підрахунками частоти в емпіричній вибірці.
Нехай - випадкова величина, що позначає результат одного перевертання монети, де позначає голівки, а - хвости.
CDF за справедливу монету надається:
Якщо ви перевернули 2 голови та 1 хвіст, емпіричним CDF буде:
Емпіричний CDF відображає, що у вашому зразку ваших фліп були головами.
Нехай - нормально розподілена випадкова величина із середнім значенням та стандартним відхиленням .
CDF надається:
Скажімо, у вас було 3 розіграші IID та отримано значення . Емпіричним CDF буде:
При достатньому розіграші IID (і певні умови регулярності виконуються), емпіричний CDF буде конвергуватися на базовий CDF населення.
Чи є різниця між емпіричним CDF та CDF?
Так, вони різні. Емпіричний cdf є належним cdf, але емпіричний cdfs завжди буде дискретним, навіть якщо він не виведений з дискретного розподілу, тоді як cdf дистрибутива може бути іншими речами, крім дискретних.
Якщо ви ставитеся до вибірки так, ніби це сукупність значень, кожне з яких однаково вірогідне (тобто розміщення ймовірності 1 / n на кожному спостереженні), то cdf цього розподілу буде ECDF даних.
Чому його називають "емпіричним"?
Це оцінка cdf кількості населення на основі вибірки; конкретно, якщо ви ставитеся до пропорцій вибірки за кожним окремим значенням даних і трактуєте її так, як це було ймовірністю для популяції, ви отримуєте ECDF.
Емпіричне значення має щось на кшталт "спостереження, а не теорія", і саме це означає в даному випадку ... використовуючи спостереження для визначення функції розподілу.
Емпіричний CDF побудований з фактичного набору даних (на графіку нижче я використав 100 зразків зі стандартного нормального розподілу). CDF - теоретична конструкція - це те, що ви побачили, якби ви могли взяти нескінченно багато зразків.
Емпіричний CDF зазвичай наближає CDF досить добре, особливо для великих зразків (насправді, є теореми про те, як швидко він переходить до CDF зі збільшенням розміру вибірки).
Емпіричне - це щось, що ви будуєте з даних та спостережень. Наприклад, припустимо, ви хочете знати про розподіл росту людей у країні. Ви починаєте з вимірювання людей і придумуєте гістограму, яку можна наблизити до розподілу. Тоді ви обчислюєте емпіричний CDF.
Якщо ви використовуєте статистичний розподіл (детерміновану формулу, яка дає точно такий же вихід з тими ж параметрами), ви можете також обчислити його CDF.
За даними Dictionary.com , визначення "емпіричного" включають:
отримані з досвіду чи експерименту або керуються ними
Отже, емпіричний CDF - це CDF, який ви отримуєте зі своїх даних. Це контрастує з теоретичним CDF (часто його називають "CDF"), який отримують із статистичної або ймовірнісної моделі, такої як нормальний розподіл.