Як інтерпретувати висоту ділянки щільності


12

Як слід інтерпретувати висоту ділянок щільності:

введіть тут опис зображення

Наприклад, у наведеному вище графіку пік становить приблизно 0,07 при x = 18. Чи можу я зробити висновок, що приблизно 7% значень приблизно 18? Чи можу я бути більш конкретним за це? Існує також другий пік при х = 30 з висотою 0,02. Чи означає це, що приблизно 2% значень приблизно 30?

Редагувати: Питання щодо Чи може бути значенням розподілу ймовірностей, що перевищує 1?обговорюється значення ймовірності> 1, що тут взагалі не є проблемою. Він також обговорює, що стосовно наївного класифікатора Байєса це теж не суть. Я хочу, простою мовою, мати числові умовиводи, які ми можемо зробити з таких кривих щільності. Обговорюється роль області під кривою, але моє питання полягає в конкретному, який висновок ми можемо зробити стосовно певної комбінації x та y, що існує на кривій. Наприклад, як ми можемо співвідносити x = 30 і y = 0,02 на цьому графіку. Яке твердження ми можемо написати про відношення між 30 та 0,02 тут. Оскільки щільність становить одну одиничну величину, чи можна сказати, що 2% значень виникає між 29,5 і 30,5? Якщо це так, як ми інтерпретуємо, якщо значення змінюються від 0 до 1, як у наступному сюжеті:

введіть тут опис зображення

Якщо 100% значень трапляються між 0 і 1, чому будь-яка крива є поза 0 і 1?

Тут є плоска частина при х = 0,1 до х = 0,2, де у дорівнює 0,8. Він утворює прямокутник. Як ми можемо дізнатися, яка частка значень зустрічається між x = 0,1 та x = 0,2

(PS: Якщо ви вважаєте це питання цікавим / важливим, будь ласка, підкажіть його;)



4
Перший потік, згаданий як дублікат, є релевантним, незважаючи на точне формулювання його заголовка, оскільки він робить ключовим моментом, що при розрахунку для суцільних змінних щільність ймовірності не є ймовірністю. (Більш тонка версія дозволила б чітко визначити щільність і включити можливість того, що щільність буде визначена підрахунковим показником.)
Нік Кокс

Я погоджуюся з @NickCox, хоча в додаткових редакціях більше уваги приділяється площі (що схоже на третє запитання), а також висоті (що більше нагадує друге запитання) в дуже хорошому списку тісно пов'язаних питань.
Срібна рибка

3
Існує також окреме питання, яке не піднімається в цих питаннях, і саме тому я не думаю, що це загалом дублікат будь-якого з цих питань окремо: чому в емпіричному, на відміну від теоретичних графіків щільності, може бути "щільність" поза підтримка (або спостережувані значення) розподілу? Це вимагає додаткового обговорення пропускної здатності та побудови та інтерпретації графіків щільності ядра. Можливо, це питання виграє від редагування та переорієнтації на ті питання, які не дублюють існуючі питання.
Срібна рибка

Відповіді:


6

Ви повинні бути обережними зі своїми формулюваннями тут. Припустимо, що x - суцільна величина, ймовірність будь-якого окремого значення точно дорівнює нулю. Як і раніше, говорити про ймовірність значення, яке лежить навколо якоїсь точки, це чудово, хоча ви, можливо, хочете бути трохи точнішими. Ваше друге твердження, в якому ви вказали інтервал разом з вірогідністю - це те, що я б шукав.

По суті, інтеграл функції щільності щодо x розповість про саму ймовірність (тому її називають щільністю ). Очевидно, інтервал, через який ви будете інтегруватися, може бути довільно невеликим, тому ви можете наблизитись до точки довільної міри. Однак, коли функція густини змінюється дуже повільно протягом цього інтервалу, ви можете наблизити інтеграл деякою числовою технікою, наприклад, трапецієподібним правилом .

Підсумовуючи: висота функції густини - це саме те, її висота. Все, що ви хочете зробити з висновком про ймовірність, повинно включати інтеграцію тієї чи іншої форми.


чи завжди площа під кривою завжди дорівнює 1,0 в такому вигляді сюжету?
ecologist1234

1
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.