Чому розподіл Коші не означає?


109

З функції щільності розподілу ми могли б визначити середнє значення (= 0) для розподілу Коші, як показано на графіку нижче. Але чому ми кажемо, що розподіл Коші не має ніякого значення?

введіть тут опис зображення


2
Рекомендую посилання Cabeza G., UA. (2013). La Media de la Distribución de Cauchy. У блозі Apoyo en Matemáticas про середнє поширення Коші.

Ось моя відповідь тут: stats.stackexchange.com/questions/94402/…
kjetil b halvorsen

Відповіді:


99

Ви можете механічно перевірити, що очікуваного значення не існує, але це має бути фізично інтуїтивно зрозумілим, принаймні, якщо ви приймаєте принцип Гюйгенса та Закон великих чисел . Висновок Закону великих чисел не відповідає розподілу Коші, тому він не може мати середнього значення. Якщо ви середньо незалежних випадкових змінних Коші, результат не збігається до 0, як n з ймовірністю 1 . Він залишається розподілом Коші однакового розміру. Це важливо в оптиці.n0n1

Розподіл Коші - це нормалізована інтенсивність світла на лінії від точкового джерела. Принцип Гюйгенса говорить про те, що можна визначити інтенсивність, вважаючи, що світло випромінюється з будь-якої лінії між джерелом і ціллю. Отже, інтенсивність світла на лінії, що знаходиться на відстані метрів, можна визначити, якщо припустити, що світло спочатку потрапляє на лінію в 1 метрі від нього і знову випромінюється під будь-яким кутом вперед. Інтенсивність світла на лінії, що знаходиться на відстані n метрів, може бути виражена як n- кратна згортка розподілу світла на лінії, що знаходиться на відстань 1 метр. Тобто сума n незалежних розподілів Коші - це розподіл Коші, масштабований на коефіцієнт n .21nn1nn

Якби розподіл Коші мав середнє значення, то й перцентиль n- кратної згортки, поділений на n, повинен був би сходитися до 0 Законом великих чисел. Натомість він залишається постійним. Якщо позначити 25- й перцентиль на (прозорій) лінії на відстані 1 метра, на відстані 2 метри і т.д., то ці точки утворюють пряму, на 45 градусів. Вони не нахиляються до 0 .25nn02512450

Це говорить вам, зокрема, про розподіл Коші, але ви повинні знати інтегральний тест, оскільки існують й інші дистрибутиви, які не мають чіткого фізичного тлумачення.


39
+1 Тепер є це освітлювальний відповідь :-) (вибачте). До речі, принцип названий для Крістіана Гайгенса, а не Гюйгена. Гюйгенс першим оцінив нові події у вірогідності, опубліковані в 1650-х рр. Паскалем (виходячи з його листів з Ферматом): ця ідея Гюйгенса (1657 р.), Включаючи очікування, спочатку отримала теорію ймовірностей на математичній основи та проклали шлях до семінарного (посмертного) трактату Якоба Бернуллі ( Ars Conjectandi , 1713).
whuber

4
Поширюються амплітуди, а не інтенсивності.
Дору Константин

2
Це чудова відповідь, але я вважаю кінець заплутаним: "... позначте 25 перцентиль на ... прямій, під 45 градусами. Вони не нахиляються до 0". Саме твердження вірно (як наслідок принципу Гюйгенса-Френеля), але це раніше, ніж "розділене на ". Якщо розділити на 2 на 2 метри, поділити на 3 на 3 метри, ..., тоді прозора лінія вертикальна (перпендикулярна екрану, що фіксує світло). Квантильна лінія в 45 градусів належить до суми Коші і не допомагає з аргументом (поки). n
Лі Девід Чунг Лін

40

Відповідь додано у відповідь на коментар @ whuber щодо відповіді Майкла Черникса (і переписаний повністю, щоб усунути помилку, на яку вказав whuber.)

Сказано, що значення інтеграла для очікуваного значення випадкової величини Коші не визначене, оскільки значення може бути "зроблене" таким, що йому подобається. Інтеграл

xπ(1+x2)dx
- x
xπ(1+x2)dx=limT1limT2+T1T2xπ(1+x2)dx
xπ(1+x2)dx=limT2+limT1T1T2xπ(1+x2)dx

Основне значення Коші отримують як єдину межу: замість подвійної межі вище. Головне значення інтеграла очікування легко бачити , щоб бути , оскільки limitand має цінність для всіх . Але це не можна використовувати, щоб сказати, що середнє значення випадкової величини Коші дорівнює . Тобто середнє значення визначається як значення інтеграла у звичайному сенсі, а не в сенсі головної величини.0 0 T 0

limTTTxπ(1+x2)dx
00T0

Для розглянемо замість цього інтеграл що наближається до граничного значення як . Коли , ми отримуємо головне значення обговорене вище. Таким чином, ми не можемо привласнити однозначне значення виразуα T - T xα>0ln(α)

TαTxπ(1+x2)dx=TTxπ(1+x2)dx+TαTxπ(1+x2)dx=0+ln(1+x2)2π|TαT=12πln(1+α2T21+T2)=12πln(α2+T21+T2)
Tα=10- xln(α)πTα=10
0
xπ(1+x2)dx
не вказуючи, як підходили дві нескінченності, і ігнорування цієї точки призводить до всіх різного роду ускладнення та невірні результати, оскільки не завжди все є таким, як вони здаються, коли молоко з основною цінністю маскується під крем. Ось чому, як кажуть, середнє значення випадкової величини Коші не визначене, а не значення , головне значення інтеграла.0

Якщо використовується вимірювально-теоретичний підхід до ймовірності і інтеграл очікуваного значення визначений у значенні інтеграла Лебега, то питання простіше. існує лише тоді, коли є кінцевим, і тому не визначено для випадкової величини Коші оскільки не є кінцевою.| г | E [ X ] X E [ | X | ]g|g|E[X]XE[|X|]


9
Оцінка середнього інтеграла неправильна: це нуль, а не логарифм. Проблема насправді полягає в оцінці двох меж, неявних у нескінченних інтегралах.
whuber

@whuber Дякую за вказівку на помилку. Я повністю переписав свою відповідь, і ваш коментар більше не стосується.
Діліп Сарват

Я не розумію, чому очікування співвідношення не існує. Якщо і спільно нормально розподілені зі значенням, відмінним від нуля, то середнє значення задається , що я пропускаю? Y Z = XXYxZ=XYxyp(x,y)dxdy
Рой

@Drazick У своїй відповіді я ніде не згадував співвідношення двох нормальних випадкових змінних. Будь-ласка, запитайте когось, хто порушив це питання стосовно випадкових змінних Коші.
Діліп Сарват

2
@Drazick Подивіться, чи існує ваш інтеграл взагалі. Взагалі, якщо щільність неперервна в околиці , E [X ^ {- 1}] $ не існує. 0X0
Діліп Сарват

33

Хоча наведені вище відповіді є вагомими поясненнями того, чому розподіл Коші не очікує, я вважаю, що співвідношення двох незалежних нормальних змінних є Коші так само, як ілюмінуюче: дійсно, ми have а друге очікування - .N ( 0 , 1 ) E [ | X 1 |X1/X2N(0,1)

E[|X1||X2|]=E[|X1|]×E[1|X2|]
+

1
Є"складена" випадкова величина Коші, коли я знаю, що є стандартним Коші? Як можна знайти розподіл? |X1X2|X1X2|X1X2|
StubbornAtom

1
Так, це абсолютне значення змінної Коші, яка, таким чином, має щільність над додатними реальними числами. f(x)+f(x)
Сіань

Якщо скласти звичайний розподіл, тоне нескінченність? E1/|X2|
Альберт Чен

Це нескінченність.
Сіань

22

Коші не має жодного значення, оскільки обрана вами точка (0) не є серединою. Це медіана і режим . Середнє значення для абсолютно неперервного розподілу визначається як де - функція щільності, а інтеграл приймається за область (яка до у випадку Коші). Для щільності Коші цей інтеграл просто не є кінцевим (половина від до є а половина від до - ).f f - - 0 - 0 xf(x)dxff00


9
Я вас не критикую, @Dilip: Я збільшую ваше спостереження. Що дуже цікаво, це те, що існування нульового основного значення може спокусити нас визначити середнє значення розподілу Коші (або середнє значення будь-якого RV) як основне значення інтеграла. Це набагато глибше заглиблюється в суть цього питання, яке переслідується, заявляючи, що інтеграл є нескінченним або невизначеним: а чому б не впливає основна цінність ? Чому не було б законним використовувати це як засіб?
whuber

5
@whuber Цікаво також, що якщо урізати інтеграл при -a та + a для будь-якого a> 0, ви отримаєте 0. Тож прийняття межі як підходу ∞ симетричного інтеграла дає 0. Ще одна причина запитати, чому це не так 0 середній.
Майкл Черник

10
@whuber: я вважаю, що ваше останнє питання у вашій передостанньому зауваженні є риторичним; у будь-якому випадку ми хочемо абсолютної конвергенції, і "на" причина, на мій погляд, полягає в тому, що ми хочемо, щоб речі поводилися як області. Зокрема, нам потрібно вміти розбивати речі (функції) на шматки та переставляти їх за бажанням, не порушуючи отриману відповідь. Ми не можемо зробити це відсіканням і перестановкою для лінійної функції wrt розподілу Коші, тому ми повинні наполягати на тому, що її середнє значення не існує.
кардинал

9
Це, @cardinal, є гарною відповіддю! Я не був просто риторичним, тому що саме питання задає питання: "чому ми говоримо, що [розподіл Коші не означає?" Ствердження, що сподівання не визначене, може задовольнити нерозумне, але можливість існування розумного альтернативного визначення інтеграла - і дає інтуїтивно правильну відповідь! - повинна турбувати людей. Ваша відповідь близька до того, що я мав на увазі, але все ще неповна. Я думаю, що задовільна відповідь визначила б важливі теореми статистичної теорії, які провалюються, коли ми працюємо з умовно збіжними інтегралами.
whuber

7
@Dilip я теж думав, але, поміркувавши, вважаю, що це трохи складніше, ніж ти, здається, пропонує. Наприклад, немає теореми про центральний ліміт: вимагаючи відхилення, автоматично, гарантує очікування. І багато теорем доведено за допомогою нерівності Чебишева, де ми ще раз гарантуємо собі середнє значення. Тож мені справді цікаво: які великі теореми використовуються в статистичній практиці, де ми насправді повинні усвідомлювати проблеми з умовно збіжними, але не збіжними очікуваннями?
whuber

16

fXf(X)ff

Щоб зрозуміти, чому середнє значення не існує, подумайте про x як функцію на одиничному колі. Досить легко знайти нескінченну кількість дужок, що перетинаються, на одиничному колі, таким чином, якщо одна з дуг має довжину d, то x> 1 / 4d на цій дузі. Отже, кожна з цих нероздільних дуг вносить більше 1/4 до середнього значення, а загальний внесок цих дуг нескінченний. Ми можемо зробити те ж саме знову, але з x <-1 / 4d, із загальним внеском мінус нескінченність. Ці інтервали можуть бути відображені діаграмою, але чи можна зробити схеми для перехресної перевірки?


1
Ласкаво просимо на сайт, @DavidEpstein. Ви можете створювати зображення із бажаним програмним забезпеченням та завантажувати їх у свою відповідь, натиснувши на маленьку піктограму зображення (щоб запустити майстра) над полем відповіді. На жаль, для цього вам потрібно> = 10 повторень. Я впевнений, що у вас це буде досить скоро; тим часом, якщо ви можете розмістити зображення деінде в Інтернеті та опублікувати посилання на нього у своїй відповіді, вищий репортер може отримати його та опублікувати для вас.
gung

3
Я не знав, як Коші трактують як уніформу на колі, але це, безумовно, має сенс. Топологічний аргумент показує, що не може бути безперервної функції на колі, що має властивості функції усереднення.
Джоні

UUnif[0,1]Xtan(π(U12))

Насправді з точки зору фізичної моделі джерела світла напівкругле зображення є більш доречним, оскільки не відразу зрозуміло, чому принцип Гюйгенса дав би вам стереографічну проекцію.
Лі Девід Чунг Лін

10

XP

EX=XdP

Відсутність середнього значення випадкової величини Коші просто означає, що інтеграл rv Коші не існує. Це тому, що хвости розподілу Коші - це важкі хвости (порівняйте з хвостами нормального розподілу). Однак відсутність очікуваної величини не забороняє існування інших функцій випадкової величини Коші.


5
Хвости "важкі" в тому сенсі, що вони не розпадаються досить швидко в будь-якому напрямку, щоб викликати сходження інтеграла. Ця концепція не має нічого спільного з нормальним розподілом (або будь-яким еталонним розподілом).
whuber

4
Так, дякую за цю корекцію. Я не мав на увазі будь-якого жорсткого зв'язку між важкими хвостами та нормальним розповсюдженням. Однак я думаю, що порівнювати нормальний розподіл (з легкими хвостами) та важкохвостим розподілом візуально робить (не завжди) трохи легше зрозуміти поняття «важких» хвостів.
Томаш

5

Ось більше візуального пояснення. (Для тих із нас, хто кидає виклик математиці.) Візьміть примхливий генератор випадкових чисел і спробуйте усереднити отримані значення. Ось хороша сторінка щодо функції для цього. https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable Ви виявите, що "пикавість" випадкових значень призводить до того, що вона стає більшою, якщо ви йдете замість менших . Отже, це не означає.


4

Тільки для додання відмінних відповідей я зроблю кілька коментарів щодо того, чому непослідовність інтеграла є актуальною для статистичної практики. Як вже згадували інші, якщо ми дозволили, щоб значення головного значення було "середнім", то slln вже не дійсний! Крім цього, подумайте про те, що на практиці всі моделі є наближеннями. Зокрема, розподіл Коші є моделлю для необмеженої випадкової величини. На практиці випадкові величини обмежені, але межі часто розпливчасті та невизначені. Використання необмежених моделей - це спосіб полегшити це, це робить непотрібним введення у моделі невпевнених (а часто неприродних) меж. Але щоб це мало сенс, важливі аспекти проблеми не повинні зачіпатися. Це означає, що, якби ми вводили межі, це не повинно змінювати важливу модель моделі. Але коли інтеграл неконвергентний, цього не відбувається! Модель нестабільна, в тому сенсі, що очікування RV залежатиме від значною мірою довільних меж. (У додатках не обов'язково є якась причина робити межі симетричними!)

З цієї причини краще сказати, що інтеграл розходяться, ніж говорити, що він "нескінченний", а останній є близьким до того, що має на увазі певне значення, коли його немає! Більш ретельна дискусія тут .


-4

Я хотів бути трохи вибагливим на секунду. Графіка вгорі неправильна. Вісь x знаходиться в стандартних відхиленнях, що не існує для розподілу Коші. Мені прискіпливі, тому що я використовую розподіл Коші кожен день свого життя у своїй роботі. Є практичний випадок, коли плутанина може спричинити емпіричну помилку. Т-розподіл студента з 1 ступенем свободи - це стандартний Коші. Зазвичай він перераховує різні сигми, необхідні для значущості. Ці сигми НЕ є стандартними відхиленнями, вони є ймовірними помилками, і це режим.

Якщо ви хотіли зробити вищезазначену графіку правильно, або вісь x є необробленими даними, або якщо ви хочете, щоб вони мали однакові розміри помилок, ви б дали їм однакові ймовірні помилки. Одна ймовірна помилка - 67 стандартних відхилень за розміром від нормального розподілу. В обох випадках це напівквартальний діапазон.

Що ж стосується відповіді на ваше запитання, все, що всі написали вище, є правильним, і це математична причина цього. Однак, я підозрюю, що ви студент і новачок у цій темі, тому контрінтуїтивні математичні рішення візуально очевидних можуть не відповідати правді.

У мене є два майже однакових зразки реального світу, витягнутих з розподілу Коші, обидва мають однаковий режим і однакову ймовірну помилку. Середня величина 1,27, а середня 1,23. Той, який має середнє значення 1,27, має середнє відхилення 400, а середній 1,23 - стандартне відхилення 5,15. Ймовірна помилка для обох - .32, а режим - 1. Це означає, що для симетричних даних середнє значення не знаходиться в центральній 50%. Потрібно лише ОДНЕ додаткове спостереження, щоб просунути середнє значення та / або відхилення від значущості для будь-якого тесту. Причина полягає в тому, що середнє значення та дисперсія не є параметрами, а середня вибірка, а дисперсія вибірки - самі випадкові числа.

Найпростіша відповідь полягає в тому, що параметри розподілу Коші не включають середнє значення і, отже, не розходяться щодо середнього.

Цілком ймовірно, що у вашій минулій педагогіці значення середнього значення було в тому, що це, як правило, достатня статистика. У довгостроковій статистиці на основі частоти розподіл Коші не має достатньої статистики. Це правда, що медіана вибірки для розподілу Коші з підтримкою по всій шкалі є достатньою статистикою, але це тому, що вона успадковує її не як статистику порядку. Це начебто випадково достатньо, не маючи простого способу подумати над цим. Зараз у статистиці Байєса є достатня статистика для параметрів розподілу Коші, і якщо ви використовуєте рівномірний попередній, то він також є неупередженим. Я підводжу це, тому що якщо вам доведеться користуватися ними щодня, ви дізналися про всі способи виконання їх оцінок.

Немає достовірної статистики замовлень, яка може бути використана в якості оцінювачів для усічених розподілів Коші, які ви, швидше за все, зіткнетеся в реальному світі, тому не існує достатньої статистики щодо частотних методів для більшості, але не для всіх реальних програм .

Те, що я пропоную, - це подумки відійти від середньої думки, як щось реальне. Це інструмент, як молоток, який широко корисний і зазвичай його можна використовувати. Іноді цей інструмент не працює.

Математична записка про нормальні та розподіли Коші. Коли дані приймаються як часовий ряд, то нормальний розподіл відбувається лише тоді, коли помилки сходяться до нуля, оскільки t переходить до нескінченності. Коли дані приймаються як часовий ряд, то розподіл Коші відбувається, коли помилки розходяться до нескінченності. Одне пояснюється конвергентним рядом, інше - розбіжним рядом. Розбірливі коші ніколи не надходять до конкретної точки на межі, вони перекидаються вперед і назад через фіксовану точку, так що п'ятдесят відсотків часу вони знаходяться на одній стороні, а п’ятдесят відсотків часу на іншій. Середньої реверсії немає.


9
У цій відповіді є деяка плутанина! Наприклад, там сказано: "Зараз у статистиці Байєса є достатня статистика для параметрів розподілу Коші, і якщо ви використовуєте рівномірний раніше, він також є об'єктивним". Важко це зрозуміти! По-перше, концепції частоти та баєсівської достатності дуже близькі (і я вважаю, що вони можуть відрізнятися лише в деяких дивних, нескінченно тьмяних пробних просторах, тому для реальної лінії однакові). Немає достатньої статистики для моделі Коші, фіксованого розміру! Просто (повних даних, очевидно, достатньо).
kjetil b halvorsen

-6

Простіше кажучи, площа під кривою наближається до нескінченності, коли ви зменшуєте масштаб. Якщо відібрати вибір кінцевої області, ви можете знайти середнє значення для цього регіону. Однак для нескінченності немає жодного засобу.


8
1
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.