Як пов'язаний куртоз розподілу з геометрією функції щільності?


12

Куртоз полягає в вимірюванні піку і плоскості розподілу. Функція щільності розподілу, якщо вона існує, може розглядатися як крива, і має геометричні особливості (наприклад, кривизна, опуклість, ...), пов'язані з її формою.

Тож мені цікаво, чи пов'язаний куртоз розподілу з якимись геометричними особливостями функції густини, які можуть пояснити геометричне значення куртозу?


Я прошу певного співвідношення у формулі до деякої геометричної величини кривої щільності, а не лише до туго розмитого значення, яке я зазначив у своєму дописі. Або непогано просто пояснити, чому куртоз має геометричне значення
Тим

@ Петер Це далеко не правда. Можна змінювати геометрію графіка PDF майже довільно, не змінюючи жодних заданих (скінченної кількості його) моментів.
whuber

Питання, що тісно пов'язані на сайті stats.stackexchange.com/questions/25010/…, підказує, якою має бути правильна відповідь на це питання.
whuber

@whuber, хоча я погоджуюся і дякую вам за цей приклад, мені також цікаво, чи він не говорить більше про чудову властивість цієї конкретної родини pdf, ніж про куртоз взагалі.
user603

@ user603 Це гарно дивуватися. Однак твердження не стосується цієї конкретної родини: просто трапляється, що для логістичного розподілу можна створити явне представлення класу альтернативних PDF-файлів з однаковими моментами. Це є особливим , що все з моментів однаково, але обурює більшість дистрибутивів таким чином , що фіксує кінцеве число їх моментів не складно. (Важко для певних дискретних розповсюджень, таких як Bernoulli, але у них немає PDF-файлів.)
whuber

Відповіді:


17

Моменти безперервного розподілу та такі функції, як куртоз, вкрай мало говорять про графік його функції щільності.

Розглянемо, наприклад, наступні графіки.

введіть тут опис зображення

Кожен із них - це графік негативної функції, що інтегрується в : всі вони - PDF-файли. Більше того, всі вони мають абсолютно однакові моменти - кожна остання їхня нескінченна кількість. Таким чином, вони поділяють загальний куртоз (який дорівнює )- 3 + 3 e 2 + 2 e 3 + e 413+3e2+2e3+e4

Формули для цих функцій є

fk,s(x)=12πxexp(12(log(x))2)(1+ssin(2kπlog(x))

для і- 1 s 1 , K Z .x>0, 1s1,kZ.

На малюнку відображаються значення зліва та значення вгорі. У лівій колонці відображається PDF для стандартного логістичного розподілу.кsk

Вправа 6.21 в «Розширеній теорії статистики» Кендалла (Stuart & Ord, 5-е видання) просить читача показати, що у всіх цих моментів однакові.

Можна аналогічно змінити будь-який pdf, щоб створити інший pdf кардинально іншої форми, але з однаковими другими та четвертими центральними моментами (скажімо), які, таким чином, мали б однаковий куртоз. Тільки з цього прикладу повинно бути зрозуміло, що куртоз не є легко інтерпретаційною або інтуїтивно зрозумілою мірою симетрії, унімодальності, бімодальності, опуклості чи будь-якої іншої звичної геометричної характеристики кривої.

Функції моментів, отже (і куртоз як окремий випадок) не описують геометричних властивостей графіка pdf. Це інтуїтивно має сенс: оскільки pdf представляє ймовірність за допомогою області, ми можемо майже вільно переміщувати щільність ймовірностей навколо з одного місця на інше, докорінно змінюючи зовнішній вигляд pdf, фіксуючи будь-яке обмежене число заздалегідь заданих моментів.


1
"Тільки з цього прикладу повинно бути чітко зрозуміло ... будь-яка інша знайома геометрична характеристика кривої". Я розумію, що ви маєте на увазі, але тут є підстави для розумної розбіжності в інтерпретації. Інша інтерпретація - це Дарлінгтон, який показує, як, починаючи з симетричного розподілу, переміщення деякої маси в конкретних точках збільшує / зменшує куртоз (знову ж таки, не суперечність вашого прикладу, просто більш «позитивне» розуміння).
user603

1
@ user603 Я не погоджуюся, але думаю, що "позитивний" підхід не враховує особливих припущень, які явно зроблені для того, щоб він взагалі працював. Можна також почати з графіка вкрай асиметричного PDF, чия косисть дорівнює нулю (їх не важко побудувати). Таким чином, позитивний підхід просто описує те, що відбувається з певними дуже спеціальними PDF-файлами, коли маса рухається навколо. Хоча це може бути досить корисним для інтуїції, схоже, це не має жодного логічного відношення до цього питання.
whuber

1
Я погоджуюсь на хиткість (і на вашу відповідь взагалі). Але куртоз, як функція, має мінімум. Це робить речі трохи цікавішими.
користувач603

1
@ user603 Дякую; це глибока відмінність. Я не думаю, що це змінює будь-який із цих висновків важливими способами, але це, безумовно, допомагає інтуїції та вказує на важливу різницю між парними та непарними моментами.
whuber

6

Для симетричних розподілів (тобто тих, для яких мають значення навіть центрировані моменти) куртоз вимірює геометричну особливість основної PDF-карти. Неправда, що куртоз вимірює (або взагалі пов'язаний) з піком поширення. Швидше за все, куртоз вимірює, наскільки далекий від основного розподілу від симетричного та бімодального (алгебраїчно, ідеально симетричний та бімодальний розподіл матиме куртоз 1, що є найменшим значенням, яке може мати куртоз) [0].

У двох словах [1], якщо ви визначаєте:

k=E(xμ)4/σ4

з , тоE(X)=μ,V(X)=σ2

k=V(Z2)+11

для .Z=(Xμ)/σ

Це означає, що можна розглядати як міру дисперсії навколо його очікування 1. Іншими словами, якщо ви маєте геометричну інтерпретацію дисперсії та очікування, то випливає куртоз.Z 2kZ2

[0] Р. Б. Дарлінгтон (1970). Чи справді куртоз "пік?". Американський статистик, Vol. 24, № 2.

[1] JJA Moors (1986). Значення куртозу: Дарлінгтон переглянуто. Американський статистик, том 40, випуск 4.


1
Скрізь, де ви пишете "бімодал", ви, мабуть, маєте на увазі "одномодальний"?
whuber

1
Так, ці приклади працюють для симетричних розподілів. Явний може бути побудований із сімейств псевдонормальних: візьміть один із цих (нескінченно модальних) pdfs із середнім значенням та визначте новий pdf якЗмішуючи невелику кількість з розподілом мінімального куртозу, ви виявляєте, що існують розподіли з нескінченно багатьма режимами, куртоз яких довільно близький до мінімального значення . Так, принаймні, куртоз нічого не говорить про бімодальність. Оскільки це не саме те, яку геометричну властивість pdf він описує? μ g ( x ) = ( f ( x ) + f ( 2 μ - x ) ) / 2. g 1fμg(x)=(f(x)+f(2μx))/2.g1
whuber


1
Куртоз не вказує на бімодальність, за винятком випадків, коли він знаходиться біля свого мінімуму, де він вказує на щось подібне до двоточкового рівномірного розподілу. Можна мати бімодальні розподіли з усіма можливими значеннями куртозу. Дивіться приклади ncbi.nlm.nih.gov/pmc/articles/PMC4321753 .
Пітер Вестпад

1
Так; див. папір, яку я пов’язав. Перше речення реферату Декарло абсолютно неправильне. Якщо ви не хочете читати мою роботу, ось математика: візьміть будь-який симетричний бімодальний розподіл і змішайте його з набагато ширшим симетричним розподілом, що має таку саму серединну, як і бімодальна. Суміш симетрична і бімодальна для малого . Налаштувавши більш широке розповсюдження та змішуючи , ви можете зробити діапазон куртозів до нескінченності. І ви можете отримати куртоз настільки маленьким, як хочете, використовуючи .5N (-1, v) + .5N (1, v), дозволяючи . Симетричні та бімодальні pdfs легко побудувати для всіх куртозів. p v 0ppv0
Пітер Вестпад

5

[NB це було написано у відповідь на інше запитання на сайті; відповіді були об'єднані в це питання. Ось чому ця відповідь, здається, відповідає на питання, яке інше формулюється. Однак значна частина публікації повинна бути актуальною тут.]

Куртоз насправді не вимірює форму розподілів. Можливо, в деяких сімействах поширення можна сказати, що він описує форму, але, загалом, куртоз не дуже розповідає про фактичну форму. На форму впливає багато речей, включаючи речі, не пов'язані з куртозом.

Якщо ви шукаєте зображення для куртозу, з'являється досить багато зображень, як це:

p

які, замість цього, виявляють мінливу дисперсію, ніж збільшують куртоз. Для порівняння, ось три нормальних щільності, які я щойно намалював (використовуючи R) з різними стандартними відхиленнями:

введіть тут опис зображення

Як бачите, він виглядає майже ідентично попередньому малюнку. Усі вони мають однаковий куртоз. Навпаки, ось приклад, напевно, ближчий до того, що діаграма мала на меті

введіть тут опис зображення

Зелена крива є і більш піковою, і важче хвостовою (хоча цей дисплей не дуже підходить для того, щоб побачити, наскільки важчий хвіст насправді). Синя крива менш пікова і має дуже легкі хвости (насправді у неї немає хвостів, що перевищують стандартні відхилення від середнього).6

Це зазвичай мають на увазі люди, коли вони говорять про куртоз із зазначенням форми щільності. Однак куртоз може бути тонким - він не повинен працювати так.

Наприклад, при заданій дисперсії вищий куртоз може насправді виникати з нижчим піком.

Потрібно також остерігатися спокуси (і в численних книгах це відкрито зазначено), що нульовий перевищення куртозу передбачає нормальність. Існують розподіли з надлишком куртозу 0, які не схожі на звичайні. Ось приклад:

dgam 2.3

Дійсно, це також ілюструє попередній пункт. Я міг би легко побудувати подібний на вигляд розподіл з більшим куртозом, ніж нормальний, але який все ще дорівнює нулю в центрі - повна відсутність піку.

На сайті є ряд дописів, які далі описують куртоз. Один з прикладів тут .


Але я цього не сказав? У книзі сказано?
Stat Tistician

Я знаю це. Я ніколи не казав, що ти це сказав. Як би ви запропонували мені відповісти на відверто неправильні твердження, про які ви питаєте? Просто зробіть вигляд, що вони не помиляються?
Glen_b -Встановіть Моніку

1
@Glen_b Фотографії не з книги. Книга не дає ілюстрацій. Я використовував пошук зображень goolge для цих ілюстрацій.
Stat Tistician

2
Деякі автори пишуть про куртоз як про піку, а деякі пишуть його як вагу хвоста, але скептична інтерпретація того, що куртоз є будь-якими заходами щодо куртозу, є єдиною цілком безпечною історією. Числові приклади, наведені Ірвігом Капланським (1945 р.), Досить, щоб показати, що куртоз не має жодної інтерпретації однозначно. (Стаття Капланський є одним з небагатьох , які він писав в середині 1940-х років по ймовірності та статистики. Він більш відомий як видатний алгебраиста.) Повний довідник і багато іншого в stata-journal.com/sjpdf.html?articlenum=st0204
Нік Кокс

1
Є книги та статті, які стверджують, що куртоз - це пік, тому мій перший пункт залишається правильним, а також підтримується як твердження про те, що є в літературі. Більш важливим є те, як можна розглядати приклади та аргументи Капланського.
Нік Кокс

3

μ±σ

Редагувати 23.11.2018: Після написання цього допису я розробив деякі геометричні перспективи щодо куртозу. Одне полягає в тому, що надлишковий куртоз справді можна візуалізувати геометрично з точки зору відхилень від очікуваної лінії 45 градусів у хвостах нормальної квантильно-квантильної ділянки; див. Чи вказує цей графік QQ лептокуртичний або платикуртичний розподіл?

pV(v)V={(Xμ)/σ}4XE(V)VX

μ±σXμ±σμσX0.25μ±σμσ


3
Замість того, щоб просто продовжувати посилати людей на папір у більшості своїх дописів, ви б не заперечували підсумовувати аргументи тут? Дивіться допомогу тут у розділі "завжди надайте контекст для посилань", зокрема там, де написано "завжди цитуйте важливу частину". Це не обов'язково буквально цитувати його там, де аргумент обширний, але потрібен хоча б короткий виклад аргументу. Ви просто зробите кілька виразних заяв і потім посилаєтеся на папір. Заява про те, що куртоз вимірює поведінку хвоста, - вводить в оману (
мабуть,

2
... але неможливо не погодитися з аргументами, яких ви тут не викладете, і, можливо, можна прийти до більш нюансованого висновку.
Glen_b -Встановити Моніку

Мої аргументи чітко викладені тут: en.wikipedia.org/wiki/… Коментарі вітаємо! До речі, ексцес IS заходи хвоста ваги, просто не такий же , як і інші , які були розглянуті. Він вимірює вагу хвоста через E (Z ^ 4), що є мірою ваги хвоста, оскільки значення | Z | <1 так мало сприяють цьому. За тією ж логікою, E (Z ^ n) для вищих рівних потужностей n також є мірою ваги хвоста.
Пітер Вестфалл

Привіт Пітер, відвідайте stats.stackexchange.com/help/merging-accounts, щоб об’єднати свої акаунти, щоб ви могли змінити свої старі публікації.
whuber

3

Відповідь різного типу: ми можемо проілюструвати куртоз геометрично, використовуючи ідеї з веб-сайту http://www.quantdec.com/envstats/notes/class_06/properties.htm : графічні моменти.

k=E(Xμσ)4=(xμσ)4f(x)dx
fXμ,σ2x ke=k3

Далі я покажу графічний графічний куртоз для деяких симетричних розподілів, зосереджений на нулі та масштабуючи, щоб мати відхилення 1.

зоровий куртоз для деяких симетричних розподілів

Зауважте віртуальну відсутність внеску в куртоз з центру, що показує, що куртоз не має великого відношення до "піку".


1
Z2b+bb
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.