Чи є пояснення, чому існує стільки природних явищ, які слідують за нормальним поширенням?


29

Я думаю, що це захоплююча тема, і я її не повністю розумію. Який закон фізики робить так, що стільки природних явищ мають нормальне поширення? Більш інтуїтивно здавалося б, що вони мали б рівномірний розподіл.

Мені так важко це зрозуміти, і я відчуваю, що мені не вистачає інформації. Чи може хтось допомогти мені з хорошим поясненням або зв’язати мене з книгою / відео / статтею?


Перевірте це .
Антоні Пареллада

7
Чи є у вас вагомі підстави думати, що ваше приміщення насправді так?
Glen_b -Встановіть Моніку

4
Насправді нормальний розподіл може бути не «домінуючим» розподілом у природі. Існує багато явищ і поведінки, які надзвичайно цінуються, важко хвости або описують функції закону влади. Gabaix документує багато економічних та фінансових варіантів цього класу розподілу у своїй праці " Закони про економіку: вступ , об'єднаний тут ... pages.stern.nyu.edu/~xgabaix/papers/pl-jep.pdf Shalizi, et ін. обговоріть їх емпіричну оцінку в цій роботі Розподіл влади-закону в емпіричних даних , зв'язаних тут ... santafe.edu/media/workingpapers/07-12-049.pdf
Майк Хантер

Хто сказав вам, що нормальний розподіл все-таки був домінуючим?
shadowtalker

1
@DJohnson +1 для посилань, але важливо зазначити, що ключова знахідка у Clauset et al. документ полягає в тому, що не так вже й багато емпіричних розподілів закону про владу, які б настійно підтримувалися! Цитуючи висновки, "Лише в одному випадку - розподіл частот зустрічань слів в англійському тексті - закон про владу видається справді переконливим в тому сенсі, що він чудово вписується в дані і жодна з альтернатив не містить жодної вага ".
Sycorax каже, що повернеться Моніка

Відповіді:


31

Дозвольте розпочати, заперечуючи припущення. Роберт Гірі, ймовірно, не перебільшував випадок, коли сказав (у 1947 р.) " ... нормальність - це міф; нормального розподілу ніколи не було і ніколи не буде ". -
нормальний розподіл - це модель *, наближення, яке іноді є більш-менш корисним.

* (про що, див. Джордж Бокс , хоча я віддаю перевагу версії в своєму профілі).

Що деякі явища є приблизно нормальними, може не викликати подив, оскільки суми незалежних [або навіть не надто сильно корельованих ефектів] повинні, якщо їх багато, і жодне не має дисперсії, істотної порівняно з дисперсією сума решти, яку ми можемо побачити, як розподіл, як правило, виглядає нормальніше.

Центральна гранична теорема (що стосується конвергенції до нормального розподілу стандартизованого зразка середнього значення, коли переходить до нескінченності при деяких м'яких умовах) принаймні говорить про те, що ми можемо побачити тенденцію до цієї нормальності з досить великими, але кінцевими розмірами вибірки.н

Звичайно, якщо стандартизовані засоби приблизно нормальні, стандартизовані суми будуть; це причина міркувань "сума багатьох ефектів". Отже, якщо внесок у варіацію дуже мало, і вони не дуже співвідносяться, ви, можливо, схильні бачити це.

Теорема Беррі-Ессена дає нам твердження про це (конвергенція до нормальних розподілів), що насправді відбувається зі стандартизованими засобами вибірки для iid даних (за дещо жорсткіших умов, ніж для CLT, оскільки вимагає, щоб третій абсолютний момент був кінцевим), як а також розповісти про те, як швидко це відбувається. Подальші версії теореми мають справу з неідентично розподіленими компонентами в сумі , хоча верхні межі відхилення від нормальності менш тісні.

Менш формально поведінка згортків із досить приємними розподілами дає нам додаткові (хоча й тісно пов’язані) причини, щоб підозрювати, що у багатьох випадках це може бути справедливим наближенням до кінцевих вибірок. Конволюція виступає своєрідним оператором "розмазування", з яким люди, які використовують оцінку щільності ядра в різних ядрах, будуть знайомі; як тільки ви стандартизуєте результат (тому дисперсія залишається незмінною щоразу, коли ви робите таку операцію), видно чіткий прогрес до все симетричніших форм гірки, коли ви повторно згладжуєте (і не має великого значення, якщо ви змінюєте ядро ​​кожен раз).

Террі Тао дає деяке цікаве обговорення версій центральної граничної теореми і Беррі-есе теоремі тут , і по шляху згадує підхід до не-незалежної версії Беррі-есе.

Тож існує хоча б один клас ситуацій, коли ми можемо очікувати, що це побачимо, і формальні причини вважати, що це дійсно буде траплятися в таких ситуаціях. Однак у кращому випадку будь-який сенс того, що результат "сум багатьох ефектів" буде нормальним, є наближенням. У багатьох випадках це цілком розумне наближення (і в додаткових випадках, хоча наближення розподілу не є близьким, деякі процедури, які передбачають нормальність, не особливо чутливі до розподілу окремих значень, принаймні у великих вибірках).

Є багато інших обставин, коли ефекти не «додаються», і там ми можемо очікувати, що трапляться й інші речі; наприклад, у багатьох фінансових даних ефекти, як правило, є мультиплікаційними (ефекти зміщуватимуться у відсотках, наприклад відсотки та інфляція та курси валют). Там ми не очікуємо нормальності, але ми можемо іноді спостерігати грубе наближення до нормальності за шкалою журналу. В інших ситуаціях це не може бути доречним, навіть у грубому сенсі. Наприклад, часи між подіями, як правило, не будуть добре наближені ні нормальністю, ні нормальністю журналів; тут немає жодних "сум" чи "продуктів" ефектів, які б сперечатися. Існують численні інші явища, які ми можемо зробити певний аргумент для певного виду "закону" за конкретних обставин.


12
+1. Ваш аргумент починає, на мій погляд, цілком правдоподібно говорити про те, що може бути психологічна відповідь на таке питання, як групова думка: коли всі у вашій галузі бачать нормальні розподіли, хто ти, щоб сказати інакше? Це стосується особливо галузей дослідження, де статистичні процедури розглядаються як пішохідні інструменти, необхідні, можливо, для освячення документа для публікації, але в іншому випадку мають мало притаманне значення чи інтерес.
whuber

2
Щоб навести конкретний приклад, коли Квелет винайшов ІМТ (індекс маси тіла), він явно робив це таким чином, що давав нормально розподілену кількість. Ми говорили про це тут: stats.stackexchange.com/questions/64171/…
Метт Крауз

Мені здається, що всі намагаються оминати це питання, а не відповідати на нього.
Дігіо

Гірі був статистиком, тому недарма він вважав, що нормальність - це міф. Якби він був фізиком, він би бачив це інакше.
Аксакал

Коментарі не для розширеного обговорення; ця розмова переміщена до чату .
Glen_b -Встановіть Моніку

20

Існує відомий вислів Габріеля Ліппмана (фізика, лауреата Нобелівської премії), який сказав Пуанкаре:

[Нормальний розподіл] неможливо отримати жорсткими відрахуваннями. Декілька його можливих доказів жахливі [...]. Тим не менш, всі вірять у це, як сказав мені один день М. Ліппманн, оскільки експериментатори уявляють, що це математична теорема, а математики вважають це експериментальним фактом.

- Анрі Пуанкаре, Le Calcul des Probabilités . 1896 рік

[Cette loi] ne s'obtient pas par des déductions rigoureuses; плюс d'une démonstration qu'on a voulu en donner est grossière [...]. Tout le monde y croit cependant, я відключаю un jour M. Lippmann, car les expérimentateurs s'imaginent que c'est un théorème de mathématiques, et les mathématiciens que c'est un fait expérimental.

Здається, що у нашому списку статистичних цитат немає цієї цитати, тому я вважав, що було б добре розмістити її тут.


Зниження? Хтось тут таємно ненавидить Пуанкаре?
Амеба каже, що повернеться до Моніки

Мої знання з фізики закінчуються тим, що я вивчив у середній школі, але хіба Гаусс спочатку не вивчав розподіл у контексті звичайних рівнянь з фізики? На моє враження у Вікіпедії було враження, що Гауссові помилки природним чином випадають із класичної фізичної моделі
shadowtalker

2
Ми повинні більше шанувати Ліппмана як автора цього головного моту . Габріель Ліппман був лауреатом Нобелівської премії з фізики. (М. тут просто означає мсьє, природа.)
Нік Кокс

3
@ssdecontrol Як я пам'ятаю, Гаусса цікавили звичайні помилки спостереження , особливо в галузі астрономії та геодезії, але досить розумні, щоб знати, що припущення було сумнівним. (Він також, наприклад, використовував абсолютне відхилення медіани від медіани як стійкий показник поширення в 1816 році.)
Нік Кокс

Досить справедливо, @Nick. Я відредагував, щоб уточнити.
амеба каже, що повернеться до Моніки

7

Який закон фізики робить так, що стільки природних явищ мають нормальне поширення? Більш інтуїтивно здавалося б, що вони мали б рівномірний розподіл.

Нормальний розподіл є загальним місцем у природничих науках. Звичайне пояснення, чому це трапляється в помилках вимірювання, відбувається через деяку форму міркувань великих чисел або центральної граничної теореми (CLT), яка зазвичай йде так: "оскільки на результати експерименту впливає нескінченно велика кількість порушень, що надходять від непов'язаних джерел CLT припускає, що помилки зазвичай розподіляються ". Наприклад, ось уривок зі статистичних методів в аналізі даних WJ Metzger:

Більшість того, що ми вимірюємо, насправді є сумою багатьох rv. Наприклад, ви вимірюєте довжину столу лінійкою. Довжина, яку ви вимірюєте, залежить від безлічі дрібних ефектів: оптичного паралакса, калібрування лінійки, температури, вашої тремтячої руки тощо. Цифровий лічильник має електронний шум у різних місцях своєї схеми. Таким чином, те, що ти вимірюєш, - це не тільки те, що ти хочеш виміряти, але додаєш до нього велику кількість (сподіваємось) невеликих внесків. Якщо ця кількість невеликих внесків велика, CLT говорить нам, що їх загальна сума розподілена по Гауссу. Це часто трапляється і є причиною функцій вирішення, як правило, гауссова.

Однак, як ви повинні знати, це не означає, що, звичайно, кожен розподіл буде нормальним. Наприклад, розподіл Пуассона так само часто зустрічається у фізиці при роботі з процесами підрахунку. У спектроскопії розподілу Коші (він же Брейт Вігнер) використовується для опису форми спектрів випромінювання тощо.

Я зрозумів це після написання: усі три згадані до цього часу дистрибуції (Гауссан, Пуассон, Коші) є стабільними розподілами , а Пуассон - дискретно стабільним . Тепер, коли я подумав про це, здається важлива якість розподілу, яка змусить його пережити агрегації: якщо додати купу чисел з Пуассона, сума - це Пуассон. Це може «пояснити» (в деякому сенсі), чому це так всюдисуще.

У неприродних науках ви повинні бути дуже обережними із застосуванням нормального (або будь-якого іншого) розподілу з різних причин. Особливо кореляція та залежність є проблемою, оскільки вони можуть порушити припущення CLT. Наприклад, у галузі фінансів добре відомо, що багато серій виглядають як звичайні, але мають набагато важчі хвости , що є великою проблемою в управлінні ризиками.

Нарешті, в природничих науках є більш солідні причини того, що вони мають нормальний розподіл, ніж щось міркування "махання рукою", яке я цитував раніше. Поміркуйте, броунівський рух. Якщо поштовхи справді незалежні і нескінченно малі, то неминуче розподіл спостережуваного шляху буде мати нормальний розподіл завдяки CLT, див. Наприклад, урівень (10) у відомому творі Ейнштейна " ДОСЛІДЖЕННЯ НА ТЕОРІЮ БРОВНЯНСЬКОГО РУХУ ". Він навіть не потрудився назвати це сьогоднішньою назвою "Гаусса" або "нормальної".

ΔхΔpΔхΔp тут .

Отже, не дивуйтеся, коли отримувати дуже різні реакції на використання Гаусса розповсюдження від дослідників у різних сферах. У деяких галузях, таких як фізика, очікується, що певні явища природним чином пов'язані з розподілом Гаусса на основі дуже твердої теорії, підкріпленої величезною кількістю спостережень. В інших сферах звичайний розподіл використовується для його технічної зручності, зручних математичних властивостей або інших сумнівних причин.


1
+1. Цитата є розумним, однак можна відзначити , що виміряна довжина не може бути негативною (тобто обмежена) , так що не може дійсно слідувати нормальному розподілу. Це завжди наближення.
амеба каже, що повернеться до Моніки

Неприродні науки? Ви маєте на увазі, як незвичайні експерименти доктора Франкенштейна? ;-)
Sycorax заявила, що повернеться Моніка

1
@ User777, це лауреат Нобелівської премії Ландау «s жарт :" науки можна розділити на три типи: природні, неприродні і antinatural "
аксакал

@Aksakal: Я думаю, що саме ця посилання має неправильне значення; Ландау сказав, що науки поділяються на "естетичні, неестественні та противоестественні" (замість "сверхъестественные"). Не знаю, як це перекласти.
Амеба каже: Відновити Моніку

@amoeba, я перекладаю "неестественные" як "неприродні". "сверхъестественные" - це "надприродне", я думаю. Можливо, росіяни можуть мене виправити.
Аксакал

2

тут є дуже багато надмірно складних пояснень ...

Хороший спосіб, як це було пов'язано зі мною, полягає в наступному:

  1. Згорніть одну матрицю, і ви маєте рівну ймовірність прокрутити кожне число (1-6), а значить, PDF є постійним.

  2. Скрутіть дві кубики та підсумовуйте результати разом, і PDF вже не є постійним. Це тому, що існує 36 комбінацій, а підсумковий діапазон - від 2 до 12. Ймовірність виникнення 2 є унікальною сингулярною комбінацією 1 + 1. Ймовірність 12 є унікальною також тим, що вона може виникати лише в одній комбінації 6 + 6. Тепер, дивлячись на 7, є кілька комбінацій, тобто 3 + 4, 5 + 2 і 6 + 1 ( та їх зворотні перестановки). Коли ви працюєте далеко від середнього значення (тобто 7), існують менші комбінації для 6 і 8 тощо, поки ви не дістанетесь до сингулярних комбінацій 2 і 12. Цей приклад не призводить до чіткого нормального розподілу, але тим більше гине ви додасте, і чим більше зразків ви будете брати, тим результат буде спрямований до нормального розподілу.

  3. Тому, коли ви підсумовуєте діапазон незалежних змінних, що підлягають випадковому коливанню (у кожного з яких можуть бути свої PDF-файли), тим більше отриманий результат буде прагнути до нормальності. Це в шести знаках Sigma дає нам те, що ми називаємо «Голосом процесу». Це те, що ми називаємо результатом "загальної варіювання" системи, і, отже, якщо результат прагне до нормальності, то ми називаємо цю систему "статистичним контролем процесів". Якщо вихід ненормальний (перекошений або зміщений), то ми говоримо, що система піддається «особливій зміні причини», в якій був якийсь «сигнал», який певним чином змінює результат.

Сподіваюся, що це допомагає.


1

Який закон фізики робить так, що стільки природних явищ мають нормальне поширення?

Не маю уявлення. З іншого боку, я також не маю уявлення, чи це правда, чи справді те, що означає «стільки».

Однак трохи переставивши проблему, є вагомі підстави припустити (тобто моделювати ) безперервну величину, яка, на вашу думку, має фіксовану середню величину та дисперсію з нормальним розподілом. Це тому, що нормальний розподіл є результатом максимізації ентропії з урахуванням цих моментів. Оскільки, грубо кажучи, ентропія є мірою невизначеності, що робить Нормальний найбільш некомісійним або максимально невизначеним вибором форми розподілу.

Тепер ідея, що слід вибирати розподіл шляхом максимізації його ентропії з відомими обмеженнями, насправді має певну фізичну підтримку з точки зору кількості можливих способів їх виконання. Джейнес зі статистичної механіки тут є стандартним посиланням.

Зауважте, що хоча максимальна ентропія мотивує нормальні розподіли в цьому випадку, можуть бути показані різні види обмежень, що призводять до різних сімей розподілу, наприклад, знайомий експонент, пуассон, двочлен тощо.

Про компанію Sivia and Skilling 2005 ch.5 проходить інтуїтивно зрозуміла дискусія.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.