Дозвольте розпочати, заперечуючи припущення. Роберт Гірі, ймовірно, не перебільшував випадок, коли сказав (у 1947 р.) " ... нормальність - це міф; нормального розподілу ніколи не було і ніколи не буде ". -
нормальний розподіл - це модель *, наближення, яке іноді є більш-менш корисним.
* (про що, див. Джордж Бокс , хоча я віддаю перевагу версії в своєму профілі).
Що деякі явища є приблизно нормальними, може не викликати подив, оскільки суми незалежних [або навіть не надто сильно корельованих ефектів] повинні, якщо їх багато, і жодне не має дисперсії, істотної порівняно з дисперсією сума решти, яку ми можемо побачити, як розподіл, як правило, виглядає нормальніше.
Центральна гранична теорема (що стосується конвергенції до нормального розподілу стандартизованого зразка середнього значення, коли переходить до нескінченності при деяких м'яких умовах) принаймні говорить про те, що ми можемо побачити тенденцію до цієї нормальності з досить великими, але кінцевими розмірами вибірки.н
Звичайно, якщо стандартизовані засоби приблизно нормальні, стандартизовані суми будуть; це причина міркувань "сума багатьох ефектів". Отже, якщо внесок у варіацію дуже мало, і вони не дуже співвідносяться, ви, можливо, схильні бачити це.
Теорема Беррі-Ессена дає нам твердження про це (конвергенція до нормальних розподілів), що насправді відбувається зі стандартизованими засобами вибірки для iid даних (за дещо жорсткіших умов, ніж для CLT, оскільки вимагає, щоб третій абсолютний момент був кінцевим), як а також розповісти про те, як швидко це відбувається. Подальші версії теореми мають справу з неідентично розподіленими компонентами в сумі , хоча верхні межі відхилення від нормальності менш тісні.
Менш формально поведінка згортків із досить приємними розподілами дає нам додаткові (хоча й тісно пов’язані) причини, щоб підозрювати, що у багатьох випадках це може бути справедливим наближенням до кінцевих вибірок. Конволюція виступає своєрідним оператором "розмазування", з яким люди, які використовують оцінку щільності ядра в різних ядрах, будуть знайомі; як тільки ви стандартизуєте результат (тому дисперсія залишається незмінною щоразу, коли ви робите таку операцію), видно чіткий прогрес до все симетричніших форм гірки, коли ви повторно згладжуєте (і не має великого значення, якщо ви змінюєте ядро кожен раз).
Террі Тао дає деяке цікаве обговорення версій центральної граничної теореми і Беррі-есе теоремі тут , і по шляху згадує підхід до не-незалежної версії Беррі-есе.
Тож існує хоча б один клас ситуацій, коли ми можемо очікувати, що це побачимо, і формальні причини вважати, що це дійсно буде траплятися в таких ситуаціях. Однак у кращому випадку будь-який сенс того, що результат "сум багатьох ефектів" буде нормальним, є наближенням. У багатьох випадках це цілком розумне наближення (і в додаткових випадках, хоча наближення розподілу не є близьким, деякі процедури, які передбачають нормальність, не особливо чутливі до розподілу окремих значень, принаймні у великих вибірках).
Є багато інших обставин, коли ефекти не «додаються», і там ми можемо очікувати, що трапляться й інші речі; наприклад, у багатьох фінансових даних ефекти, як правило, є мультиплікаційними (ефекти зміщуватимуться у відсотках, наприклад відсотки та інфляція та курси валют). Там ми не очікуємо нормальності, але ми можемо іноді спостерігати грубе наближення до нормальності за шкалою журналу. В інших ситуаціях це не може бути доречним, навіть у грубому сенсі. Наприклад, часи між подіями, як правило, не будуть добре наближені ні нормальністю, ні нормальністю журналів; тут немає жодних "сум" чи "продуктів" ефектів, які б сперечатися. Існують численні інші явища, які ми можемо зробити певний аргумент для певного виду "закону" за конкретних обставин.