Якщо ми хочемо наочно бачити розподіл безперервних даних, який з гістограм та pdf слід використовувати?
Які відмінності між гістограмою та pdf не відрізняються від формули?
Якщо ми хочемо наочно бачити розподіл безперервних даних, який з гістограм та pdf слід використовувати?
Які відмінності між гістограмою та pdf не відрізняються від формули?
Відповіді:
Щоб уточнити точку Діркса:
Скажімо, ваші дані є зразком нормального розподілу. Ви можете побудувати наступний сюжет:
Червона лінія - це емпірична оцінка щільності, синя - теоретичний pdf основного нормального розподілу. Зауважте, що гістограма виражається тут у щільності, а не у частотах. Це робиться для побудови графіків, загалом частоти використовуються в гістограмах.
Отже, щоб відповісти на ваше запитання: ви використовуєте емпіричний розподіл (тобто гістограму), якщо хочете описати зразок, і pdf, якщо хочете описати гіпотезований базовий розподіл.
Ділянка генерується за допомогою наступного коду в R:
x <- rnorm(100)
y <- seq(-4,4,length.out=200)
hist(x,freq=F,ylim=c(0,0.5))
lines(density(x),col="red",lwd=2)
lines(y,dnorm(y),col="blue",lwd=2)
Гістограма - це вікова оцінка перед комп’ютерним віком. Оцінка щільності є альтернативою.
У наші дні ми використовуємо і те, і інше, і є багата література про те, які за замовчуванням варто використовувати.
З іншого боку, pdf - це вираз закритої форми для заданого розповсюдження. Це відрізняється від опису вашого набору даних з розрахунковою щільністю або гістограмою.
density
*ab*
дає ab (курсив) **ab**
дає ab (жирним шрифтом) $\sqrt{2}$
=
Тут немає жорсткого і швидкого правила. Якщо ви знаєте щільність свого населення, то PDF-файл краще. З іншого боку, ми часто маємо справу з пробами, і гістограма може передавати інформацію, яку оцінюється щільність. Наприклад, Ендрю Гелман зазначає це:
Ключовою перевагою гістограми є те, що вона, як графік необроблених даних, містить насіння власної оцінки помилок. Або, по-іншому, зубчастість злегка згладженої гістограми виконує корисну послугу, візуально вказуючи на мінливість вибірки. Ось чому, якщо подивитися на гістограми в моїх книгах та опублікованих статтях, я майже завжди використовую багато бункерів. Я також майже ніколи не люблю оцінок щільності ядра, які люди іноді використовують для відображення одновимірних розподілів. Я б краще побачив гістограму і знав, де дані.
Гістограма відносної частоти ( дискретна )
Гістограма щільності ( дискретна )
Функція щільності ймовірності PDF ( безперервна )
Ці посилання були корисними :) http://stattrek.com/statistics/dictionary.aspx?definition=Probability_density_function
Безперервна_проблема_розподіл із зазначеного вище сайту
http://www.geog.ucsb.edu/~joel/g210_w07/lecture_notes/lect04/oh07_04_1.html