У кого важчий хвіст, лонормальний або гамма?


41

(Це засновано на питанні, яке щойно прийшло до мене електронною поштою; я додав деякий контекст із попередньої короткої розмови з тією ж людиною.)

Минулого року мені сказали, що гамма-розподіл важчий, ніж логічний, і з тих пір мені сказали, що це не так.

  • Що є більш важким хвостом?

  • Які ресурси я можу використати для вивчення стосунків?


3
Людині, яка щойно прихилилася: Було б корисно знати, що сприймається проблемою у питанні.
Glen_b

1
Хіба я не був, я давно виступав за цю пропозицію. Однак я підозрюю, що мова йшла про корисність важкої хвороби та куртозу в контексті припущень тестування в присутності людей, які не мають нічого спільного з тим, про що ви запитували. Спростування, ІМХО, є проблематичним .
Карл

Відповіді:


41

(Правий) хвіст розподілу описує його поведінку при великих значеннях. Правильний об'єкт дослідження не є його щільність - що в багатьох практичних випадках не існує - а її функція розподілу . Більш конкретно, оскільки повинен піднятися асимптотично до для великих аргументів (Законом повної ймовірності), нас цікавить, наскільки швидко він наближається до цієї асимптотики: нам потрібно дослідити поведінку функції її виживання як .F 1 x 1 - F ( x ) x ЖЖ1х 1-Ж(х)х

В Зокрема, одне розподілу для випадкової величини є «важче» , ніж іншим при умови , що в кінцевому підсумку має більше ймовірності того, при великих значеннях , ніж . Це можна формалізувати: повинно існувати кінцеве число таким, що для всіх ,X G F G x 0 x > x 0 Pr F ( X > x ) = 1 - F ( x ) > 1 - G ( x ) = Pr G ( X > x ) .ЖХГ ЖГх0х>х0

ПрЖ(Х>х)=1-Ж(х)>1-Г(х)=ПрГ(Х>х).

Малюнок

Червона крива на цьому малюнку є функцією виживання для розподілу Пуассона . Синя крива - це розподіл Гамма , який має однакову дисперсію. Врешті-решт синя крива завжди перевищує червону, показуючи, що ця гамма-розподіл має більш важкий хвіст, ніж цей розподіл Пуассона. Ці розподіли не можна легко порівняти за допомогою щільності, оскільки розподіл Пуассона не має щільності.( 3 )(3)(3)

Це вірно , що , коли щільність і існують і для , то важче хвостами , ніж . Однак зворотне хибне - і це є переконливою причиною для визначення визначення важкості хвоста на функціях виживання, а не на густинах, навіть якщо часто аналіз хвостів може бути легше провести з використанням густин.g f ( x ) > g ( x ) x > x 0 F Gfгf(х)>г(х)х>х0ЖГ

Контрприклади можна побудувати, взявши дискретний розподіл позитивної необмеженої підтримки, який, тим не менш, не є більш важким, ніж (дискретизуючий зробить трюк). Перетворіть це на безперервний розподіл, замінивши масу ймовірності у кожній з його опорних точок , записану , на (скажімо) масштабний розподіл Beta на підтримку на відповідний інтервал і зважено . Враховуючи невелике додатне число виберітьG G H k h ( k ) ( 2 , 2 ) [ k - ε ( k ) , k + ε ( k ) ] h ( k ) δ , ε ( k ) f ( k ) / δ δ H + ( 1 - δ ) G G G δ H f GНГГНкгод(к)(2,2)[к-ε(к),к+ε(к)]год(к)δ,ε(к)достатньо мала, щоб гарантувати, що пікова щільність цього масштабованого бета-розподілу перевищує . За побудовою суміш - це безперервний розподіл , хвіст якого схожий на (він рівномірно крихітний на суму ), але має шипи у своїй щільність при опорі і всі ці шипи мають точки, де вони перевищують щільність . Таким чином легше хвостами , ніж , але незалежно від того , як далеко в хвості ми туди буде точки , де його щільність перевищує .f(к)/δδН+(1-δ)ГГ'ГδНf F FГ'ЖЖ

Малюнок

Червона крива - це PDF-розподіл Гамма-розподілу , крива золота - PDF логістичного розподілу , а синя крива (зі шипами) - PDF суміші побудованої як у контрприкладі. (Зверніть увагу на вісь логарифмічної щільності.) Функція виживання близька до функції розподілу Гамми (з швидко розпадаються хитаннями): вона в кінцевому підсумку зростатиме менше, ніж у , навіть якщо її PDF завжди буде вище цього з незалежно від того, наскільки далеко ми не заглядаємо в хвости.ГЖГ'Г'ЖЖ


Обговорення

Між іншим, ми можемо виконати цей аналіз безпосередньо на функціях виживання лонормальних та гамма-розподілів, розширивши їх навколо щоб знайти їх асимптотичну поведінку, і зробимо висновок, що всі логістики мають більш важкі хвости, ніж у всіх гамм. Але, оскільки ці розподіли мають "хороші" щільності, аналіз легше проводиться, показуючи, що для досить великого логістична щільність перевищує гамма-щільність. Однак не будемо плутати цю аналітичну зручність із значенням важкого хвоста.х=х

Аналогічно, хоча більш високі моменти та їх варіанти (такі як косоокість та куртоз) трохи говорять про хвости, вони не дають достатньої інформації. Як простий приклад, ми можемо скоротити будь-який лонормальний розподіл при такому великому значенні, що будь-яке число його моментів ледве зміниться - але тим самим ми видалимо його хвіст цілком, зробивши його більш легким, ніж будь-який розподіл з необмеженим підтримка (наприклад, Gamma).

Справедливим запереченням проти цих математичних суперечок було б зазначити, що така поведінка, яка знаходиться так далеко у хвості, не має практичного застосування, бо ніхто ніколи не вірить, що будь-яка модель розподілу буде дійсною при таких екстремальних (можливо фізично недосяжних) значеннях. Це показує, однак, що у програмах нам слід обережно визначити, яка частина хвоста викликає занепокоєння, та проаналізувати їх відповідно. (Наприклад, періоди повторної повені можна зрозуміти в цьому сенсі: 10-річні повені, 100-річні повені та 1000-річні повені характеризують окремі ділянки хвоста розповсюдження повені.) Хоча застосовуються ті самі принципи: Основним об'єктом аналізу тут є функція розподілу, а не його щільність.


6
+1 відмінне обговорення того, чому він повинен базуватися на функції виживання. Я порекомендував першоджерелу питання, щоб вони мали ознайомитися з вашою відповіддю.
Glen_b

1
(+1) для хорошої вірогідної дискусії про те, як інтерпретувати функцію виживання.

Це визначення важких хвостів чудово, як одне визначення. Але це має серйозні проблеми. Зокрема, існують обмежені розподіли, які, можливо, мають важкі хвости, такі як розподіл .9999 * U (-1,1) + .0001 * U (-1000,1000). За даним "визначенням" розподіл N (0,1) має більш важкі хвости, ніж розподіл .9999 * U (-1,1) + .0001 * U (-1000,1000). Це, очевидно, нерозумно. Давайте визначимось: існує нескінченно багато способів вимірювання хвостості розподілу.
Пітер Вестпад

1
@Peter "Дурість" виникає тому, що ти, здається, здобув ідеї назад. Жоден із ваших прикладів не має "важкого" хвоста в жодному сенсі, тому що вони обмежені. Обидві функції виживання зрештою дорівнюють нулю, і тому обидва хвоста однаково легкі.
whuber

1
@PeterWestfall Ви порівняли хвости, що обмежили підтримку, з тими, що мають нескінченну підтримку, як би це було значимим. Існує багато контекстів, в яких це було б непотрібно, навіть нерозумно. У тих контекстах, в яких можна порівняти їх, може бути доречним коефіцієнт різниці. Існує не так багато контекстів поза цим, і якщо ви можете придумати один, скажіть.
Карл

30

Гамма і лонормальне - це правильне перекос, розподіл постійних коефіцієнтів коливання на , і вони часто є основою "конкуруючих" моделей для конкретних видів явищ.(0,)

Існують різні способи визначення тяжкості хвоста, але в цьому випадку я думаю, що всі звичні показують, що логоритм важчий. (Про що може говорити перша людина - це те, що відбувається не в далекому хвості, а трохи праворуч від режиму (скажімо, біля 75-го перцентиля на першому сюжеті внизу, що для логістики трохи нижче 5 а гамма трохи вище 5.)

Однак давайте для початку просто вивчимо це питання.

Нижче наведені гамма та лонормальна щільність із середнім значенням 4 та дисперсією 4 (верхній сюжет - гама темно-зеленого кольору, лонормальна - синього кольору), а потім журнал густини (нижній), тож ви можете порівняти тенденції у хвостах:

введіть тут опис зображення

Важко побачити багато деталей у верхньому сюжеті, тому що всі дії справа від 10. Але це зовсім зрозуміло на другому сюжеті, де гамма рухається вниз набагато швидше, ніж лонормальне.

Ще один спосіб дослідити взаємозв’язок - подивитися на щільність колод, як у відповіді тут ; ми бачимо, що щільність колод для лонормальної є симетричною (це нормально!), а для гами - лівосторонній, з легким хвостом справа.

Ми можемо це зробити алгебраїчно, де ми можемо розглядати співвідношення щільності як (або логічний коефіцієнт). Нехай - гумальна щільність і логічна:g fxgf

log(g(x)/f(x))=log(g(x))log(f(x))

=журнал(1Γ(α)βαхα-1е-х/β)-журнал(12πσхе-(журнал(х)-мк)22σ2)

=-к1-(α-1)журнал(х)-х/β-(-к2-журнал(х)-(журнал(х)-мк)22σ2)

=[c-(α-2)журнал(х)+(журнал(х)-мк)22σ2]-х/β

Термін у [] є квадратичним у , а решта зменшується лінійно у . Незалежно від того, що в підсумку знизиться швидше, ніж квадратичне збільшення, незалежно від значення параметрів . У обмеженні, як , журнал відношення щільності зменшується до , що означає, що гама pdf з часом значно менша, ніж лонормальний pdf, і вона постійно зменшується. Якщо прийняти відношення в інший бік (з лонормальним вгорі), воно в підсумку повинно перевищити будь-яку межу.x - x / β x - журнал(х)х-х/βх-

Тобто, будь-яка дана логіка в кінцевому підсумку є важчою, ніж будь-яка гама.


Інші визначення важкості:

Деякі люди зацікавлені в косості або куртозі для вимірювання тяжкості правого хвоста. При заданому коефіцієнті варіації лонормальне значення має і більше перекосів, і має більший куртоз, ніж гамма . **

Наприклад, при косості гама має косисть 2CV, тоді як лонормальна - 3CV + CV .3

Є деякі технічні терміни різних заходів , як важкі хвости тут . Ви можете спробувати деякі з цих двох дистрибутивів. Лонормальне є цікавим особливим випадком у першому визначенні - всі його моменти існують, але його MGF не збігається вище 0, тоді як MGF для Gamma конвергується в районі навколо нуля.

-

** Як згадує Нік Кокс нижче, звичайне перетворення для наближення нормальності для гами, перетворення Вілсона-Гільферті, слабше, ніж лог - це кубічне перетворення кореня. При невеликих значеннях параметра фігури згадується четвертий корінь, замість цього див. Обговорення в цій відповіді , але в будь-якому випадку це слабша трансформація для досягнення майже нормальності.

Порівняння косоокості (або куртозу) не говорить про необхідні стосунки в крайньому хвості - це натомість щось говорить про середню поведінку; але з цієї причини може працювати краще, якщо початковий пункт не робився про крайній хвіст.


Ресурси : легко користуватися такими програмами, як R або Minitab, Matlab або Excel, або будь-що, що вам подобається, малювати щільності та журнали, а також журнали відношень щільності ... і так далі, щоб побачити, як все йде в конкретних випадках. Саме з цього я б запропонував почати.


4
Дійсно, це говорить про те, але немає необхідного зв’язку між вершиною, важким хвостом і куртозом; Існують контрприклади таких очікувань, тому ми повинні остерігатися. Другий сюжет хоча підтверджує підозру.
Glen_b

5
Ось однолінійний. Це визначення, що трансформація журналу потрібна для того, щоб зробити лонормальне нормальним; це гарне наближення, що корінь куба робить гаму нормальною (Вілсон-Гільферті - це два слова для мудрих); розподіл, що потребує більш сильної трансформації, знаходиться «далі» від нормального або гауссового.
Нік Кокс

2
@Glen_b Я лише додаю трохи прикраси до дуже твого гарного вигляду торта.
Нік Кокс

2
@ Nick Cox Я не згоден із твердженнями про перетворення. Математично нелегітимна частина - це висновок, який ви намагаєтеся зробити: з того, що логарифм робить лонормальний нормальним, а корінь куба робить гаму приблизно нормальною, ви не можете зробити жодного висновку про хвости жодного з них.
whuber

2
Спасибі; Ваша думка для мене зрозуміліша, але я дотримуюся формулювання "великого пальця" і теж посилаюся на досвід. Ясна річ, у мене немає теореми.
Нік Кокс

7

Хоча куртоз пов'язаний із важкістю хвостів, він би більше сприяв уявленню про розподіл жиру , а також відносно менше до самої важкості хвоста, як видно з наступного прикладу. Тут я зараз відновлюю те, що я дізнався у публікаціях вище та нижче, які є справді чудовими коментарями. По-перше, площа правого хвоста - це область від x до функції щільності, AKA функція виживання, . Для логічного розподілу і розподіл гамиf ( x ) 1 - F ( t ) e - ( log ( x ) - μ ) 2f(х)1-Ж(т)βαxα-1e-βxе-(журнал(х)-мк)22σ22πσх;х01βαхα-1е-βхΓ(α);х0, порівняємо їх функції виживання та графічно. Для цього я довільно встановлюю відповідні їх відхилення і , а також їх відповідні надлишкові куртози і дорівнює, вибравши і для . Це показує12erfc(журнал(х)-мк2σ)Q(α,βх)=Γ(α,βх)Γ(α)(еσ2-1)е2мк+σ2αβ23е2σ2+2е3σ2+е4σ2-66αмк=0,σ=0,8α0,19128,β0,3354211-F (x) для LND синього кольору, а GD - помаранчевого

функція виживання для лонормального розподілу (LND) синього кольору та гамма-розподілу (GD) оранжевим. Це приводить нас до нашої першої обережності. Тобто, якби цей сюжет був усім, що ми мали б вивчити, ми могли б зробити висновок, що хвіст для GD важчий, ніж для LND. Що це не так, показано розширенням таким чином значень осі x для графіку 1-F (x) для більш тривалого графіка LND та GD

Цей графік показує, що 1) навіть при рівних куртозах правильні хвостові ділянки LND та GD можуть відрізнятися. 2) Сама графічна інтерпретація має свої небезпеки, оскільки вона може відображати результати лише для фіксованих значень параметрів у обмеженому діапазоні. Таким чином, виникає потреба знайти загальні вирази для граничного відношення функції виживання . Я не зміг цього зробити з нескінченними розширеннями серій. Однак мені вдалося це зробити за допомогою посередника термінальних або асимптотичних функцій, які не є унікальними функціями, і тоді, коли для правого хвоста тоді достатньо для іlimхS(LND,х)S(ГД,х)limхЖ(х)Г(х)=1Ж(х)Г(х)бути взаємно асимптотичними. При належному дотриманні уваги до пошуку цих функцій це може потенційно визначити підмножину більш простих функцій, ніж самі функції виживання, які можуть бути спільними або утримуватися спільно з більш ніж однією функцією щільності, наприклад, дві функції різної щільності можуть поділятись обмежуючий експоненціальний хвіст. У попередній версії цього допису це саме те, що я мав на увазі "додану складність порівняння функцій виживання". Зауважте, що і (До речі, не обов'язково іlimуerfc(у)е-у2πу=1limуΓ(α,у)е-ууα-1=1erfc(у)<е-у2πуΓ(α,у)<е-ууα-1 . Тобто не слід вибирати верхню межу, просто асимптотичну функцію). Тут ми пишемо і де співвідношення термінів правої руки має те саме обмеження, що і як у лівій частині. Спрощення граничного співвідношення врожаїв правої руки12erfc(журнал(х)-мк2σ)<е-(журнал(х)-мк2σ)22(π(журнал(х)-мк))2σΓ(α,βх)Γ(α)<е-βх(βх)α-1Γ(α)хα<1limхσΓ(α)(βх)1-αеβх-(мк-журнал(х))22σ22π(журнал(х)-мк)= означає, що для x досить великої області хвоста LND є настільки великі, як нам подобається, порівняно з областю хвоста GD, незалежно від значення параметрів. Тому виникає ще одна проблема: у нас не завжди є рішення, які відповідають дійсним для всіх значень параметрів, тому використання лише графічних ілюстрацій може ввести в оману. Наприклад, права хвоста площа розподілу гамма більша за хвостову область експоненціального розподілу, коли , менша, ніж експоненціальна, коли а ГД - це точно експоненціальне розподіл, коли .α<1α>1α=1

Яке ж використання приймати логарифми відношення функцій виживання, оскільки нам, очевидно, не потрібно приймати логарифми, щоб знайти граничне співвідношення? Багато функцій розподілу містять експоненціальні доданки, які виглядають простішими при прийнятті логарифму, і якщо відношення переходить до нескінченності в межі, коли х зростає, то і логарифм буде робити це. У нашому випадку це дозволило би нам перевірити , яку деякі люди вважають простішими для перегляду. Нарешті, якщо відношення функцій виживання перейде до нуля, то логарифм цього відношення перейде до-limх(журнал(σΓ(α)(βх)1-α2π(журнал(х)-мк))+βх-(мк-журнал(х))22σ2)=-, і в усіх випадках після знаходження межі логарифма відношення ми повинні взяти антилогіартизм цього значення, щоб зрозуміти його зв'язок із граничним значенням звичайного відношення функції виживання.


2
У цьому випадку (і досить часто у випадках, що цікавлять) вищий куртоз відповідає більш важкому хвосту, але як загальне положення, це не так - контрприклади легко побудувати.
Glen_b

1
1. Я не знаю жодного загального способу, якщо безпосередньо порівнювати хвости. 2. Що це складніше? відповідь Уаубера показує нам, чому виникає проблема з поглядом на що-небудь, крім функції виживання (для правого хвоста); він обговорює, чому ви не можете детально порівнювати pdfs, але подібні моменти переносяться на куртоз. Крім того, порівняння часто набагато менш складне, ніж порівняння куртозу. (У лівому хвості ви порівняєте безпосередньо, але це питання не було.)F ( x )S(х)=1-Ж(х)Ж(х)
Glen_b

2
Я також зауважу, що ви говорите "Це має щось спільне з теоремою про моменти, яка говорить про те, що якщо (усі?) Моменти двох розподілів рівні, то розподіли однакові". - навіть якщо всі моменти двох розподілів рівні, розподіли не обов'язково однакові. Контрприклади обговорюються у відповідях на декілька питань, що містяться у резюме. Вам потрібно більше, ніж всі рівні моменти - вам потрібно, щоб MGF існував у районі 0.
Glen_b

1
@PeterWestfall Напівкінечну підтримку часто приймають, наприклад, як для концентрації ліків у плазмі крові. У такому випадку хворобливість визначає, чи означає середній час перебування наркотиків в організмі (наприклад, експоненціальний розподіл) чи ні (наприклад, деякі розподіли Парето). 0т<
Карл

1
@PeterWestfall Я розумію, подібно до nma.berkeley.edu/ark:/28722/bk000471p7j . Потрібно нагадати, що кожен розподіл передбачає різні заходи для різних речей. Наприклад, середнє екстремальне значення MVUE для розташування рівномірного розподілу, а не середнього значення, а не медіани. Між цими крайніми значеннями хвости важкі, але поза ними хвости блискавки. Що це має відношення до вищого моменту, як куртоз, коли перший момент не MVUE, я б не ризикнув здогадатися. Щось, може, але що?
Карл
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.