Яке значення функції у статистиці?


19

У моєму класі обчислення ми зіткнулися з функцією , або "кривою дзвону", і мені сказали, що в статистиці вона часто застосовується.ex2

З цікавості хочу запитати: чи справді важлива в статистиці функція ? Якщо так, то що це з приводу що робить його корисним та які є його додатки?ex2ex2

Я не зміг знайти багато інформації про функцію в Інтернеті, але, провівши деякі дослідження, я знайшов зв’язок між кривими дзвінка взагалі та чимось, що називається нормальним розподілом . Сторінка Вікіпедії пов'язує ці типи функцій із додатком статистики, виділяючи мною, що говорить:

"Нормальний розподіл вважається найбільш помітним розподілом ймовірностей у статистиці. Є кілька причин для цього: 1 По-перше, нормальний розподіл виникає з центральної граничної теореми, яка стверджує, що в м'яких умовах намальована сума великої кількості випадкових величин від того ж розподілу розподіляється приблизно нормально, незалежно від форми вихідного розподілу ".

Отже, якщо я збираю велику кількість даних з якогось опитування чи подібного, вони можуть бути розподілені однаково між такою функцією, як ? Функція є симетричною, наскільки її симетричність, тобто її корисність для нормального розподілу, що робить її такою корисною у статистиці? Я просто міркую.ex2

Загалом, що робить корисним у статистиці? Якщо нормальний розподіл є єдиною областю, то що робить унікальним або особливо корисним серед інших функцій типу гаусса при нормальному розподілі? e - x 2ex2ex2


Ну для початку це слід читати "означати", а не "суму".
Трістан

2
Сума теж. Зрештою, це просто середнє значення, помножене на кількість зразків.
Ерік

1
Цитата показує, що ключові слова для пошуку включають "нормальний розподіл". Здійснюючи цей пошук, тут знайдено понад 600 ниток - в середньому по одній на день з часу створення цього веб-сайту. Недовгий час, який переглядає ці хіти, швидко допоможе кожному оцінити роль "кривої дзвіночки" у статистиці.
whuber

4
З голосової нитки, що стосується звичайних розподілів : "Усі вірять у експоненціальний закон помилок [тобто нормальний розподіл]: експериментатори, тому що вони думають, що це може бути доведено математикою; і математики, тому що вони вважають, що це має були встановлені спостереженням ".
whuber

Дивіться відповіді на моє запитання "які найдивовижніші характеристики гауссового розподілу" stats.stackexchange.com/questions/4364/…
robin girard

Відповіді:


12

Причиною того, що ця функція є важливою, є насправді нормальний розподіл та його тісно пов'язаний супутник, центральна межа теореми (у нас є деякі хороші пояснення CLT в інших питаннях тут).

У статистиці CLT зазвичай може використовуватися для обчислення ймовірностей приблизно, роблячи такі твердження, як "ми на 95% впевнені, що ..." можливо (значення "95% впевнені" часто неправильно зрозуміло, але це вже інше).

Функція - це (масштабована версія) функція щільності нормального розподілу. Якщо випадкову кількість можна змоделювати за допомогою нормального розподілу, ця функція описує, наскільки ймовірні різні можливі значення зазначеної кількості. Результати в регіонах з високою щільністю є більш імовірними, ніж результати в регіонах з низькою щільністю.exp((xμ)22σ2)

і σ - параметри, що визначають розташування та масштаб функції густини. Він симетричний приблизно μ , тому зміна μ означає, що ви зміщуєте функцію вправо або вліво. σ визначає значення функції щільності при її максимальному рівні ( x = μμσμμσx=μ ) і як швидко вона переходить до 0, коли відходить від μ . У цьому сенсі зміна σ змінює масштаб функції.xμσ

Для конкретного вибору μ=0 і щільність (пропорційна)e - x 2 . Це не особливо цікавий вибір цих параметрів, але це має перевагу, що дає функцію щільності, яка виглядає дещо простіше, ніж усі інші.σ=1/2ex2

З іншого боку, ми можемо перейти від до будь-якої іншої нормальної щільності шляхом зміни змінних x = u - μex2. Причина того, що ваш підручник говорить, щоe-x2, а неexp(-(x=uμ2σex2, дуже важливою функцією є те, щоe-exp((xμ)22σ2) простіше писати.ex2


1
(+1) Перше речення передостаннього абзацу: я можу сказати , пропорційний замість є .
кардинал

@cardinal: Спасибі, ви цілком праві! Я відредагував відповідь.
MånsT

1
+1, мені дуже подобається ця відповідь. Одне, на що варто звернути увагу, - це те, що pdf звичайного зазвичай пишеться з попереду. Причина в тому, що загальна площа під кривою дорівнює12πσ2 , але оскільки типовим використанням pdf є визначення ймовірностей (сума яких дорівнює 1), то зручно для площі під кривою дорівнювати 1, і таким чином ділимо на загальну для досягнення цього результату. Я думаю, ти маєш рацію, що це було пропущено через його простіший вигляд. 2πσ2
gung - Відновіть Моніку

3

Ви маєте рацію, нормальний розподіл або гаусса - це масштабований і зміщений , тому важливість досвіду ( - x 2 )exp(x2)exp(x2) здебільшого випливає з того, що це по суті нормальний розподіл.

А нормальний розподіл важливий головним чином тому, що ("за умов легкої регулярності") сукупність багатьох незалежних і однаково розподілених випадкових величин наближається до нормального, коли "багато" наближається до нескінченності.

Не все зазвичай розподілено. Наприклад, результатів ваших опитувань може бути не принаймні, якщо відповіді навіть не в безперервній шкалі, а щось на зразок цілих чисел 1–5. Але середнє значення результатів зазвичай розподіляється за повторним відбором, оскільки середнє значення - це лише масштабована (нормалізована) сума, і окремі відповіді не залежать одна від одної. Припустимо, що зразок є досить великим, оскільки, строго кажучи, нормальність з'являється лише тоді, коли розмір вибірки стає нескінченним.

Як ви бачите з прикладу, нормальний розподіл може з’являтися в результаті процесу оцінки або моделювання, навіть коли дані зазвичай не поширюються. Тому нормальні розподіли є скрізь у статистиці. У байєсівській статистиці багато задніх розподілів параметрів приблизно нормальні, або їх можна вважати такими, що є.


ex2

Вони не є синонімами, дякую, що вказали на це. (Мій намір полягав не в тому, щоб бути точним, просто зрозумілим нестатисту. Вже є хороша точна відповідь.)
scellus

-1

n01/nn


Для коментарів до цього питання створено кімнату чату на веб- сайті chat.stackexchange.com/rooms/3720/… . Я видалив усі (50!) Коментарів і заблокував цю публікацію, щоб запобігти подальшому зловживанню механізмом коментування.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.