З функції щільності розподілу ми могли б визначити середнє значення (= 0) для розподілу Коші, як показано на графіку нижче. Але чому ми кажемо, що розподіл Коші не має ніякого значення?
З функції щільності розподілу ми могли б визначити середнє значення (= 0) для розподілу Коші, як показано на графіку нижче. Але чому ми кажемо, що розподіл Коші не має ніякого значення?
Відповіді:
Ви можете механічно перевірити, що очікуваного значення не існує, але це має бути фізично інтуїтивно зрозумілим, принаймні, якщо ви приймаєте принцип Гюйгенса та Закон великих чисел . Висновок Закону великих чисел не відповідає розподілу Коші, тому він не може мати середнього значення. Якщо ви середньо незалежних випадкових змінних Коші, результат не збігається до 0, як n → ∞ з ймовірністю 1 . Він залишається розподілом Коші однакового розміру. Це важливо в оптиці.
Розподіл Коші - це нормалізована інтенсивність світла на лінії від точкового джерела. Принцип Гюйгенса говорить про те, що можна визначити інтенсивність, вважаючи, що світло випромінюється з будь-якої лінії між джерелом і ціллю. Отже, інтенсивність світла на лінії, що знаходиться на відстані метрів, можна визначити, якщо припустити, що світло спочатку потрапляє на лінію в 1 метрі від нього і знову випромінюється під будь-яким кутом вперед. Інтенсивність світла на лінії, що знаходиться на відстані n метрів, може бути виражена як n- кратна згортка розподілу світла на лінії, що знаходиться на відстань 1 метр. Тобто сума n незалежних розподілів Коші - це розподіл Коші, масштабований на коефіцієнт n .
Якби розподіл Коші мав середнє значення, то й перцентиль n- кратної згортки, поділений на n, повинен був би сходитися до 0 Законом великих чисел. Натомість він залишається постійним. Якщо позначити 25- й перцентиль на (прозорій) лінії на відстані 1 метра, на відстані 2 метри і т.д., то ці точки утворюють пряму, на 45 градусів. Вони не нахиляються до 0 .
Це говорить вам, зокрема, про розподіл Коші, але ви повинні знати інтегральний тест, оскільки існують й інші дистрибутиви, які не мають чіткого фізичного тлумачення.
Відповідь додано у відповідь на коментар @ whuber щодо відповіді Майкла Черникса (і переписаний повністю, щоб усунути помилку, на яку вказав whuber.)
Сказано, що значення інтеграла для очікуваного значення випадкової величини Коші не визначене, оскільки значення може бути "зроблене" таким, що йому подобається. Інтеграл
Основне значення Коші отримують як єдину межу: замість подвійної межі вище. Головне значення інтеграла очікування легко бачити , щоб бути , оскільки limitand має цінність для всіх . Але це не можна використовувати, щоб сказати, що середнє значення випадкової величини Коші дорівнює . Тобто середнє значення визначається як значення інтеграла у звичайному сенсі, а не в сенсі головної величини.0 0 T 0
Для розглянемо замість цього інтеграл що наближається до граничного значення як . Коли , ми отримуємо головне значення обговорене вище. Таким чином, ми не можемо привласнити однозначне значення виразу∫ α T - T xln(α)
Якщо використовується вимірювально-теоретичний підхід до ймовірності і інтеграл очікуваного значення визначений у значенні інтеграла Лебега, то питання простіше. існує лише тоді, коли є кінцевим, і тому не визначено для випадкової величини Коші оскільки не є кінцевою.∫ | г | E [ X ] X E [ | X | ]
Хоча наведені вище відповіді є вагомими поясненнями того, чому розподіл Коші не очікує, я вважаю, що співвідношення двох незалежних нормальних змінних є Коші так само, як ілюмінуюче: дійсно, ми have а друге очікування - .N ( 0 , 1 ) E [ | X 1 |
Коші не має жодного значення, оскільки обрана вами точка (0) не є серединою. Це медіана і режим . Середнє значення для абсолютно неперервного розподілу визначається як де - функція щільності, а інтеграл приймається за область (яка до у випадку Коші). Для щільності Коші цей інтеграл просто не є кінцевим (половина від до є а половина від до - ).f f - ∞ ∞ - ∞ 0 - ∞ 0 ∞ ∞
Щоб зрозуміти, чому середнє значення не існує, подумайте про x як функцію на одиничному колі. Досить легко знайти нескінченну кількість дужок, що перетинаються, на одиничному колі, таким чином, якщо одна з дуг має довжину d, то x> 1 / 4d на цій дузі. Отже, кожна з цих нероздільних дуг вносить більше 1/4 до середнього значення, а загальний внесок цих дуг нескінченний. Ми можемо зробити те ж саме знову, але з x <-1 / 4d, із загальним внеском мінус нескінченність. Ці інтервали можуть бути відображені діаграмою, але чи можна зробити схеми для перехресної перевірки?
Відсутність середнього значення випадкової величини Коші просто означає, що інтеграл rv Коші не існує. Це тому, що хвости розподілу Коші - це важкі хвости (порівняйте з хвостами нормального розподілу). Однак відсутність очікуваної величини не забороняє існування інших функцій випадкової величини Коші.
Ось більше візуального пояснення. (Для тих із нас, хто кидає виклик математиці.) Візьміть примхливий генератор випадкових чисел і спробуйте усереднити отримані значення. Ось хороша сторінка щодо функції для цього. https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable Ви виявите, що "пикавість" випадкових значень призводить до того, що вона стає більшою, якщо ви йдете замість менших . Отже, це не означає.
Тільки для додання відмінних відповідей я зроблю кілька коментарів щодо того, чому непослідовність інтеграла є актуальною для статистичної практики. Як вже згадували інші, якщо ми дозволили, щоб значення головного значення було "середнім", то slln вже не дійсний! Крім цього, подумайте про те, що на практиці всі моделі є наближеннями. Зокрема, розподіл Коші є моделлю для необмеженої випадкової величини. На практиці випадкові величини обмежені, але межі часто розпливчасті та невизначені. Використання необмежених моделей - це спосіб полегшити це, це робить непотрібним введення у моделі невпевнених (а часто неприродних) меж. Але щоб це мало сенс, важливі аспекти проблеми не повинні зачіпатися. Це означає, що, якби ми вводили межі, це не повинно змінювати важливу модель моделі. Але коли інтеграл неконвергентний, цього не відбувається! Модель нестабільна, в тому сенсі, що очікування RV залежатиме від значною мірою довільних меж. (У додатках не обов'язково є якась причина робити межі симетричними!)
З цієї причини краще сказати, що інтеграл розходяться, ніж говорити, що він "нескінченний", а останній є близьким до того, що має на увазі певне значення, коли його немає! Більш ретельна дискусія тут .
Я хотів бути трохи вибагливим на секунду. Графіка вгорі неправильна. Вісь x знаходиться в стандартних відхиленнях, що не існує для розподілу Коші. Мені прискіпливі, тому що я використовую розподіл Коші кожен день свого життя у своїй роботі. Є практичний випадок, коли плутанина може спричинити емпіричну помилку. Т-розподіл студента з 1 ступенем свободи - це стандартний Коші. Зазвичай він перераховує різні сигми, необхідні для значущості. Ці сигми НЕ є стандартними відхиленнями, вони є ймовірними помилками, і це режим.
Якщо ви хотіли зробити вищезазначену графіку правильно, або вісь x є необробленими даними, або якщо ви хочете, щоб вони мали однакові розміри помилок, ви б дали їм однакові ймовірні помилки. Одна ймовірна помилка - 67 стандартних відхилень за розміром від нормального розподілу. В обох випадках це напівквартальний діапазон.
Що ж стосується відповіді на ваше запитання, все, що всі написали вище, є правильним, і це математична причина цього. Однак, я підозрюю, що ви студент і новачок у цій темі, тому контрінтуїтивні математичні рішення візуально очевидних можуть не відповідати правді.
У мене є два майже однакових зразки реального світу, витягнутих з розподілу Коші, обидва мають однаковий режим і однакову ймовірну помилку. Середня величина 1,27, а середня 1,23. Той, який має середнє значення 1,27, має середнє відхилення 400, а середній 1,23 - стандартне відхилення 5,15. Ймовірна помилка для обох - .32, а режим - 1. Це означає, що для симетричних даних середнє значення не знаходиться в центральній 50%. Потрібно лише ОДНЕ додаткове спостереження, щоб просунути середнє значення та / або відхилення від значущості для будь-якого тесту. Причина полягає в тому, що середнє значення та дисперсія не є параметрами, а середня вибірка, а дисперсія вибірки - самі випадкові числа.
Найпростіша відповідь полягає в тому, що параметри розподілу Коші не включають середнє значення і, отже, не розходяться щодо середнього.
Цілком ймовірно, що у вашій минулій педагогіці значення середнього значення було в тому, що це, як правило, достатня статистика. У довгостроковій статистиці на основі частоти розподіл Коші не має достатньої статистики. Це правда, що медіана вибірки для розподілу Коші з підтримкою по всій шкалі є достатньою статистикою, але це тому, що вона успадковує її не як статистику порядку. Це начебто випадково достатньо, не маючи простого способу подумати над цим. Зараз у статистиці Байєса є достатня статистика для параметрів розподілу Коші, і якщо ви використовуєте рівномірний попередній, то він також є неупередженим. Я підводжу це, тому що якщо вам доведеться користуватися ними щодня, ви дізналися про всі способи виконання їх оцінок.
Немає достовірної статистики замовлень, яка може бути використана в якості оцінювачів для усічених розподілів Коші, які ви, швидше за все, зіткнетеся в реальному світі, тому не існує достатньої статистики щодо частотних методів для більшості, але не для всіх реальних програм .
Те, що я пропоную, - це подумки відійти від середньої думки, як щось реальне. Це інструмент, як молоток, який широко корисний і зазвичай його можна використовувати. Іноді цей інструмент не працює.
Математична записка про нормальні та розподіли Коші. Коли дані приймаються як часовий ряд, то нормальний розподіл відбувається лише тоді, коли помилки сходяться до нуля, оскільки t переходить до нескінченності. Коли дані приймаються як часовий ряд, то розподіл Коші відбувається, коли помилки розходяться до нескінченності. Одне пояснюється конвергентним рядом, інше - розбіжним рядом. Розбірливі коші ніколи не надходять до конкретної точки на межі, вони перекидаються вперед і назад через фіксовану точку, так що п'ятдесят відсотків часу вони знаходяться на одній стороні, а п’ятдесят відсотків часу на іншій. Середньої реверсії немає.