Чи розподіл Коші якось є "непередбачуваним" розподілом?


14

Чи розподіл Коші якось є "непередбачуваним" розподілом?

Я намагався робити

cs <- function(n) {
  return(rcauchy(n,0,1))
}

в R для безлічі n значень і помітили, що вони час від часу генерують досить непередбачувані значення.

Порівняйте це з напр

as <- function(n) {
  return(rnorm(n,0,1))
}

що завжди видає "компактну" хмару точок.

За цим малюнком це повинно виглядати як нормальний розподіл? І все-таки це можливо лише для підмножини значень. А може, хитрість полягає в тому, що стандартні відхилення Коші (на малюнку внизу) сходяться набагато повільніше (вліво і вправо) і, таким чином, дозволяють отримати більш серйозні люди, хоча з низькою ймовірністю?

https://i.stack.imgur.com/zGTLU.png

Тут нормальні rvs і cs - Коші rvs.

введіть тут опис зображення

Але через крайність людей, що випадають, чи можливо, що хвости pdf-коші ніколи не сходяться?


9
1. Ваше запитання розпливчасте / незрозуміле, тому важко відповісти; наприклад, що означає "непередбачуване" у вашому запитанні? що ви маєте на увазі під "стандартними відхиленнями Коші" та конвергенцією наприкінці? Ви, здається, ніде не обчислюєте стандартні відхилення. стандартні відхилення, що саме? 2. Багато публікацій на сайті обговорюють властивості Коші, які можуть допомогти вам зосередити своє питання. Можливо, варто також перевірити Вікіпедію. 3. Я б пропонував уникати терміна "дзвіночка"; обидві густини здаються грубо схожими на дзвіночок; просто називайте їх своїми іменами.
Glen_b -Встановити Моніку

4
Безумовно, Коші дуже важкий хвіст.
Glen_b -Встановити Моніку

1
Я розмістив кілька фактів; сподіваємось, це допоможе вам розібратися, що ви хочете знати, щоб ви могли уточнити своє запитання.
Glen_b -Встановіть Моніку

1
|x|x

2
З нормальними можливі великі люди, але вони надзвичайно рідкісні . Щільність (і у верхньому хвості, особливо актуальна для виживаючих принаймні заданого розміру, функція виживання) для нормальних голів до 0 набагато швидше, ніж це робить Коші, але, тим не менше, обидві щільності (і обидві функції виживання) підходити до 0 і жодного разу не досягти цього.
Glen_b -Встановити Моніку

Відповіді:


39

Хоча ряд публікацій на сайті стосується різних властивостей Коші, мені не вдалося знайти одного, який насправді склав їх разом. Сподіваємось, це може бути хорошим місцем для збору. Я можу це розширити.

Важкі хвости

У той час як Коші симетричний і приблизно має форму дзвона, дещо схожий на звичайне поширення, він має набагато важчі хвости (і менше «плеча»). Наприклад, є невелика, але чітка ймовірність того, що випадкова величина Коші закладе більше 1000 міжквартильних діапазонів від медіани - приблизно того ж порядку, що і звичайна випадкова величина, що становить не менше 2,67 міжквартильних діапазонів від медіани.

Варіантність

Варіантність Коші нескінченна.

Редагувати: JG в коментарях каже, що це не визначено. Якщо ми візьмемо дисперсію як середню половину відстані у квадраті між парами значень - що ідентично дисперсії, коли обидві існують, то це було б нескінченно. Однак за звичайним визначенням JG є правильним. [Проте, на відміну від засобів вибірки, які насправді не зближуються ні до чого, оскільки n стає великим, розподіл вибіркових дисперсій постійно збільшується у міру збільшення розміру вибірки; масштаб збільшується пропорційно n, або рівномірно розподіл дисперсії журналу зростає лінійно з розміром вибірки. Дійсно вважати, що версія дисперсії, яка дає нескінченність, щось нам говорить.]

Зразкові стандартні відхилення існують, звичайно, але чим більша кількість вибірки, тим більшою є тенденція (наприклад, середнє середнє відхилення вибірки при n = 10 знаходиться поблизу в 3,67 рази від параметра шкали (половина IQR), але при n = 100 - це приблизно 11,9).

Середній

Розподіл Коші навіть не має кінцевого значення; інтеграл для середнього не збігається. Як результат, навіть закони великої кількості не застосовуються - у міру зростання n вибіркові засоби не збігаються до певної фіксованої кількості (дійсно, ні до чого вони не сходяться).

Фактично, розподіл середньої вибірки від розподілу Коші такий же, як розподіл одного спостереження (!). Хвіст настільки важкий, що додавання більшої кількості в суму робить дійсно екстремальне значення, достатньо ймовірне, щоб просто компенсувати ділення на більший знаменник при взятті середнього.

Прогнозованість

Ви, звичайно, можете створити ідеально розумні інтервали прогнозування для спостережень з розподілу Коші; Є прості, досить ефективні оцінки, які добре оцінюють місцеположення та масштаб, а також можуть бути побудовані приблизні інтервали прогнозування - тому в цьому сенсі примірники Коші є "передбачуваними". Однак хвіст простягається дуже далеко, так що якщо ви хочете інтервал з високою вірогідністю, він може бути досить широким.

Якщо ви намагаєтеся передбачити центр розподілу (наприклад, в моделі регресійного типу), це може бути певним чином порівняно просто передбачити; Коші досить піковий (типовий показник масштабу дуже багато розподілу "близько" до центру), тому центр можна порівняно оцінити, якщо у вас є відповідний оцінювач.

Ось приклад:

Я генерував дані за лінійною залежністю зі стандартними помилками Коші (100 спостережень, перехоплення = 3, нахил = 1,5) та оціненими регресійними лініями трьома методами, які є достатньо надійними для інших людей: групова лінія Tukey 3 (червона), регресія Theil (темно-зелений) та L1-регресія (синій). Жоден не є особливо ефективним у Коші - хоча всі вони могли б зробити чудові вихідні точки для більш ефективного підходу.

Тим не менше, три майже збігаються в порівнянні з шумом даних і лежать дуже близько до центру, де працюють дані; в цьому сенсі Коші явно "передбачуваний".

Медіана абсолютних залишків лише трохи більша за 1 для будь-якого з рядків (більшість даних лежать досить близько до оціночної лінії); і в цьому сенсі Коші є "передбачуваним".

лінійний зв’язок з помилками Коші та трьома пристосованими регресійними лініями

Для сюжету зліва є велика чужа. Щоб краще побачити дані, я звузив шкалу на осі y вниз праворуч.


1
Важкі хвости і дисперсія, що є нескінченними, пов'язані між собою, правда?
mavavilj

Звичайно. Невизначена середня величина також пов'язана з важкими хвостами.
Glen_b -Встановити Моніку

"Є прості, досить ефективні оцінки, які добре оцінюють місцеположення та масштаб, і можуть бути побудовані приблизні інтервали прогнозування" - чи можете ви надати посилання?
Карлос Сінеллі

Коментарі не для розширеного обговорення; ця розмова була переміщена до чату .
gung - Відновіть Моніку

@Carlos Там є два різні питання - (i) прості, досить ефективні оцінки для розташування (наприклад, відповідно підстрижене середнє) та масштабування в Коші, та (ii) методи побудови інтервалу прогнозування, який би працював для Коші. Я думаю, що перший вже висвітлюється на сайті, а другий заслуговує на власне питання.
Glen_b -Встановіть Моніку

1

μσnμ±σμ±636.62σ

σ

Розповсюдження Коші з'являється досить багато в природі, особливо там, де у вас є певна форма зростання. Це також з'являється там, де крутяться речі, наприклад, скелі, що котяться вниз по пагорбах. Ви знайдете це як основний розподіл потворної суміші розподілів на фондовій біржі, хоча не як віддачу за речі, такі як антикваріат, що продається на аукціонах. Повернення за антикваріатом також належать до розповсюдження без середнього чи відхилення, але не розподілу Коші. Відмінності створюються різницею в правилах аукціону. Якщо ви змінили правила NYSE, то розподіл Коші зникне, і з’явиться інше.

Щоб зрозуміти, чому він зазвичай присутній, уявіть, що ви були учасниками дуже великого набору учасників та потенційних учасників торгів. Оскільки акції продаються на подвійному аукціоні, прокляття переможця не застосовується. У рівновазі раціональна поведінка полягає у встановленні вашої очікуваної цінності. Очікування - це форма середнього. Розподіл середніх оцінок сходиться до нормальності, оскільки розмір вибірки піде до нескінченності.

rt=pt+1pt

Це робить фондовий ринок дуже мінливим, якщо ви думаєте, що фондовий ринок повинен мати нормальний або нормальний розподіл, але несподівано нестабільний, якщо ви очікуєте важких хвостів.

Я сконструював байєсівські та частотні прогнозні розподіли для розподілу Коші і зважаючи на їхні припущення, що вони добре працюють. Прогноз Байєса мінімізує розбіжність Куллбека-Лейблера, тобто це наближення до природи за прогнозом для даного набору даних. Прогноз частотистів мінімізує середню розбіжність Куллбека-Лейблера щодо багатьох незалежних прогнозів багатьох незалежних вибірок. Однак, це не обов'язково добре для будь-якого зразка, як можна було б очікувати при середньому покритті. Хвости дійсно сходяться, але вони сходяться повільно.

Багатоваріантний Коші має ще більш засмучуючі властивості. Наприклад, хоча він, очевидно, не може коваріровать, оскільки немає середнього значення, він не має нічого подібного до матриці коваріації. Помилки Коші завжди сферичні, якщо нічого іншого не відбувається в системі. Окрім того, хоча нічого не має, і нічого теж не залежить. Щоб зрозуміти, наскільки важливим це може бути в практичному сенсі, уявіть дві країни, які зростають, і що вони торгують між собою. Помилки в одному не залежать від помилок в іншому. Мої помилки впливають на ваші помилки. Якщо одну країну переймає божевільний, помилки цього божевілля відчуваються всюди. З іншого боку, оскільки ефекти не є лінійними, як можна було б очікувати з коваріаційною матрицею, інші країни можуть розірвати зв'язки, щоб мінімізувати вплив.

Це також робить торгову війну Трампа настільки небезпечною. Друга за величиною економіка в світі після Європейського Союзу оголосила економічну війну через торгівлю проти будь-якої іншої єдиної економіки і фінансує цю війну, позичаючи гроші для боротьби з нею у тих країн, у яких вона оголосила війну. Якщо ці залежності змушені розмотати, це буде некрасиво таким чином, про який ніхто не має живої пам’яті. У нас не було подібної проблеми з часів адміністрації Джексона, коли Банк Англії взяв участь у торгівлі Атлантичним океаном.

Розподіл Коші є захоплюючим, оскільки він з'являється в експоненціальних та S-кривих системах росту. Вони плутають людей, тому що їх повсякденне життя наповнене щільністю, яка є середньою і зазвичай має розбіжність. Це робить прийняття рішень дуже складним, оскільки виходять неправильні уроки.


Мені подобається сміливий спосіб, у якому в цій відповіді математичні властивості відображаються на поведінку в реальному світі. Але чи не варто згадувати, що у усієї сторони Коучі усі свої моменти є скінченними?
Алекос Пападопулос

Це лише врізаний зліва. Номінальне планетарне обмеження бюджету є стохастичним праворуч, і оскільки грошові системи не зберігають системи, вони є нескінченними справа.
Дейв Харріс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.