Нормальний розподіл і монотонні перетворення


9

Я чув, що велика кількість, що зустрічається в природі, зазвичай розподіляється. Це, як правило, виправдано, використовуючи центральну граничну теорему, яка говорить про те, що при середньому значенні кількості iid випадкових величин ви отримуєте нормальне розподіл. Так, наприклад, ознака, яка визначається аддитивним ефектом великої кількості генів, може бути приблизно нормально розподілена, оскільки значення генів можуть поводитись приблизно так само, як іid випадкові величини.

Тепер мене бентежить те, що властивість нормального розподілу явно не є інваріантною в умовах монотонних перетворень. Отже, якщо є два способи вимірювання чогось, пов'язаного монотонним перетворенням, вони навряд чи можуть бути нормально розподіленими (якщо тільки це монотонне перетворення не є лінійним). Наприклад, ми можемо виміряти розміри крапель дощу за діаметром, площею поверхні або за обсягом. Припускаючи подібні форми для всіх крапель дощу, площа поверхні пропорційна квадрату діаметра, а об'єм пропорційний кубі діаметра. Тому всі ці способи вимірювання не можуть бути нормально розподілені.

Отже, моє питання полягає в тому, чи повинен конкретний спосіб масштабування (тобто конкретний вибір монотонного перетворення), при якому розподіл стає нормальним, повинен мати фізичне значення. Наприклад, чи слід нормально розподіляти висоту або квадрат висоти, або логарифм висоти, або квадратний корінь висоти? Чи є спосіб відповісти на це питання, розуміючи процеси, що впливають на висоту?


Як я завжди це розумів, центральна межа теореми не постулює щось про усереднення великої кількості iid випадкових величин. Швидше, він зазначає, що при відборі засобів відбору розподіл засобів стає нормальним (незалежно від розподілу, що лежить в основі вибірки). Тому я сумніваюся, чи має місце попередник вашого питання.
Генрік

Але, якщо середнє значення вибірки стає нормальним незалежно від розподілу основного розподілу, то це не те саме, що сказати "усереднення великої кількості iid випадкових величин", отримаємо нас нормальним розподілом. Мені вони здаються рівнозначними твердженнями.

Не в моїх очах (але я хотів би переконатись інакше). В одному випадку (той, про який я думаю, мається на увазі під CLT), ви отримуєте зразки з одного розподілу. Їх засоби зазвичай розподіляються. Що я розумію з питання і цитата "середня велика кількість iid випадкових змінних", це що відрізняється: окремі екземпляри від різних випадкових змінних iid визначають (або складають) ознаку. Отже, відсутність усереднення (тобто обчислення середнього значення) від одного розподілу і, отже, не застосування CLT. Я думаю, що відповіді mbq вказують на те саме питання.
Генрік

1
Ну а розподіл не повинен бути ідентичним, якщо дотримуються деякі умови. Дивіться: en.wikipedia.org/wiki/…

1
@Henrik Чи є якась значуща різниця між одним зразком з кожного з N незалежних та однаково розподілених RV та N незалежних вимірювань одного RV?
walkytalky

Відповіді:


5

Дуже гарне запитання. Я вважаю, що відповідь залежить від того, чи зможете ви визначити основний процес, який спричиняє таке вимірювання. Якщо, наприклад, у вас є докази того, що зріст - це лінійна комбінація декількох факторів (наприклад, зріст батьків, зріст бабусь і дідусів тощо), то було б природно припустити, що висота зазвичай розподіляється. З іншого боку, якщо у вас є докази чи, можливо, навіть теорія, що журнал висоти - це лінійна комбінація декількох змінних (наприклад, висота батьків журналів, журнал висот бабусь і дідусів тощо), то журнал висоти зазвичай розподіляється.

У більшості ситуацій ми не знаємо основного процесу, який визначає вимірювання відсотків. Таким чином, ми можемо зробити одну з кількох речей:

(а) Якщо емпіричний розподіл висот виглядає нормальним, то для подальшого аналізу ми використовуємо нормальну щільність, яка неявно передбачає, що висота є лінійною комбінацією декількох змінних.

(b) Якщо емпіричний розподіл не виглядає нормальним, то ми можемо спробувати деяку трансформацію, як це запропоновано mbq (наприклад, log (висота)). У цьому випадку ми неявно припускаємо, що перетворена змінна (тобто log (висота)) є лінійною комбінацією декількох змінних.

(c) Якщо (a) або (b) не допомагають, то нам доведеться відмовитися від тих переваг, які дає нам CLT та припущення про нормальність, і моделювати змінну, використовуючи деякий інший розподіл.


5

Змінення масштабу певної змінної має, коли це можливо, стосуватися якоїсь зрозумілої шкали з тієї причини, що допомагає зробити отриману модель інтерпретаційною. Однак отримана трансформація не повинна абсолютно мати фізичне значення. По суті, ви повинні брати участь в угоді між порушенням припущення про нормальність і інтерпретацією вашої моделі. Що мені подобається робити в цих ситуаціях - це оригінальні дані, дані, трансформовані таким чином, що мають сенс, а дані, трансформовані найбільш нормально. Якщо дані, трансформовані таким чином, що мають сенс, такі ж, як результати, коли дані трансформуються таким чином, щоб це було найбільш нормальним, Я повідомляю про це таким чином, що інтерпретується зі стороною зауваження, що результати є однаковими у випадку оптимально перетворених (та / або неперетворених) даних. Коли нетрансформовані дані ведуть себе особливо погано, я проводжу свої аналізи з трансформованими даними, але роблю все можливе, щоб повідомити про результати в нетрансформованих одиницях.

Крім того, я думаю, у вас є неправильне уявлення у вашому твердженні, що "величини, які зустрічаються в природі, зазвичай розподіляються". Це справедливо лише у випадках, коли значення "визначається адитивним ефектом великої кількості" незалежних факторів. Тобто, кошти та суми зазвичай розподіляються незалежно від базового розподілу, з якого вони беруться, де не передбачається нормального розподілу окремих значень. Як це було, наприклад, окремі малюнки з біноміального розподілу не виглядають нормально, але розподіл сум у 30 малюнків від біноміального розподілу виглядає досить нормально.


5

Я мушу визнати, що я не дуже розумію ваше запитання:

  • Ваш приклад краплі дощу не дуже задовольняє, оскільки це не ілюструє той факт, що поведінка Гаусса походить від "середнього великої кількості iid випадкових змінних".

  • якщо кількість Х що вас цікавить - це середній показник Y1++YNN що коливається навколо його значення гауссовим способом, ви також можете цього очікувати f(Y1)++f(YN)N має гауссова поведінка.

  • якщо коливання Х навколо його середнього значення приблизно гауссові та малі, тоді так само коливання f(Х) навколо його середнього значення (розширення Тейлора)

  • чи могли б ви навести кілька справжніх прикладів (реального життя) Гауссової поведінки, що випливають із усереднення: це не дуже часто! Поведінка Гаусса часто використовується в статистиці як перше грубе наближення, оскільки обчислення дуже простежуються. Оскільки фізики використовують гармонічне наближення, статистики використовують наближення Гаусса.


принцип максимальної ентропії також є ще однією причиною використання гауссового розподілу. Наприклад, які є вагомі причини використання гауссових помилок у лінійній моделі, окрім тяговості?
Алекк

5

Vipul, ти не дуже точний у своєму питанні.

Це, як правило, виправдано, використовуючи центральну граничну теорему, яка говорить про те, що при середньому значенні кількості iid випадкових величин ви отримуєте нормальне розподіл.

Я не зовсім впевнений, що це ви говорите, але майте на увазі, що краплі дощу у вашому прикладі не є iid випадковими змінними. Середнє значення, обчислене шляхом відбору проб певної кількості цих крапель крові, є випадковими змінними, і оскільки засоби обчислюються, використовуючи достатньо великий розмір вибірки, розподіл середнього зразка є нормальним.

Закон великої кількості говорить, що значення середнього зразка збігається до середнього значення населення (сильне або слабке залежно від типу конвергенції).

CLT говорить, що середнє значення вибірки, називаємо його XM (n), що є випадковою змінною, має розподіл, скажімо G (n). Коли n наближається до безмежності, цей розподіл є нормальним розподілом. CLT - це все про конвергенцію розподілу , а не про основне поняття.

Намальовані вами спостереження (діаметр, площа, об'єм) взагалі не повинні бути нормальними. Їх, мабуть, не буде, якщо ви їх зможете. Але, середня вибірка, отримана з усіх трьох спостережень, матиме нормальне розподіл. І об'єм не буде кубом діаметра, а також площа не буде площею діаметра. Квадрат сум не буде сумою квадратів, якщо тільки вам не пощастить.


4

Просто CLT (ні будь-яка інша теорема) не говорить про те, що кожна кількість у Всесвіті нормально розподілена. Дійсно, статистики часто використовують монотонні перетворення для поліпшення нормальності, щоб вони могли використовувати свої улюблені інструменти.


4

Я думаю, ви неправильно зрозуміли (половину) статистику використання звичайного розподілу, але мені дуже подобається ваше запитання.

Я не думаю, що це гарна ідея систематично припускати нормальність, і я визнаю, що це робиться колись (можливо, тому, що нормальний розподіл є простежуваним, одномодальним ...) без перевірки. Звідси ваше зауваження про монотонну карту чудово!

Однак повноцінне використання нормальності приходить, коли ви створюєте собі нові статистичні дані, такі, як, наприклад, та, яка з'являється, коли ви застосовуєте емпіричну частину очікування: емпіричне значення . Отже, емпіричне значення та загальне вирівнювання - це те, що нормальність з'являється скрізь ...


2

Як випадкова величина, так і безліч її перетворень можуть бути приблизно нормальними; Дійсно, якщо дисперсія невелика порівняно із середньою величиною, можливо, дуже різноманітні перетворення виглядають цілком нормально.

> a<-rgamma(10000,1000,1000)
> hist(a)
> hist(1/a)
> hist(a^2)
> hist(a^(3/2))

4 гістограми, що показують майже нормальність

( натисніть для збільшення версії )

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.