Які саме моменти? Як вони отримані?


19

Ми, як правило, знайомимося з методом оцінювачів моментів, "прирівнюючи моменти населення до їх вибіркового аналога", поки ми не оцінимо всі параметри сукупності; так що у випадку нормального розподілу нам знадобляться лише перший та другий моменти, оскільки вони повністю описують цей розподіл.

Е(Х)=мкi=1нХi/н=Х¯

E(X2)=μ2+σ2i=1nXi2/n

І ми могли б теоретично обчислити до n додаткових моментів як:

E(Xr)i=1nXir/n

Як я можу побудувати інтуїцію для того, якими є насправді моменти? Я знаю, що вони існують як поняття як у фізиці, так і в математиці, але я не знаходжу жодного безпосередньо застосовного, тим більше, що я не знаю, як зробити абстракцію від поняття маси до точки даних. Термін, схоже, використовується в статистиці певним чином, який відрізняється від використання в інших дисциплінах.

Яка характеристика моїх даних визначає, скільки ( r ) моментів у цілому?


7
Термін означає те саме, що він робить у фізиці, коли застосовується до розподілу ймовірностей. Дивіться тут , яке має рівняння , " де \ rho - розподіл щільності заряду, маси чи будь-якої кількості, що розглядається ". Коли "річ, що розглядається" - це щільність ймовірності, у вас є відповідний момент ймовірності. Це сирі моменти (моменти про походження). Для порівняння ... ( ρμn=rnρ(r)drρ
ctd

2
Моменти - це параметризовані особливості розподілу випадкових змінних, таких як кванти. Моменти параметризуються натуральними числами і повністю характеризують розподіл (див. Функцію генерації моменту ). Це не виключає, що для деяких розподілів може існувати ідеальна функціональна залежність між моментами, тому для характеристики розподілу не завжди потрібні всі моменти. (1/2)
чакраварти

Моменти функціонально залежать від перших двох для нормального розподілу, тому перших двох достатньо для характеристики розподілу, включаючи середнє та дисперсію. (2/2)3
чакраварти

5
(ctd) ... моменти математики однакові ( ), за винятком а не 0 (тобто просто узагальнену форму фізики - але, оскільки вони однакові із простою зміною походження, фізик справедливо сказав би "як це по-різному?"). Вони такі самі, як імовірність, коли f - щільність. Мені всі троє говорять про одне й те саме, коли кажуть «моменти», а не різні речі. мкн=-(х-c)нf(х)гхcf
Glen_b -Встановіть Моніку

3
Я впевнений, що ви зможете знайти відповіді у багатьох публікаціях про моменти та інтуїцію . Статистика використовує моменти точно так само, як їх використовують у фізиці та математиці - це те саме поняття з однаковим визначенням у всіх трьох сферах.
whuber

Відповіді:


17

З давніх пір я взяв урок фізики, тому повідомте мене, якщо щось із цього невірно.

Загальний опис моментів з фізичними аналогами

Візьміть випадкову змінну, . П -й момент X навколо з становить: м п ( с ) = Е [ ( X - з ) п ] Це в точності відповідає фізичному змісту миті. Уявіть X як сукупність точок вздовж реальної лінії з щільністю, заданою pdf. Помістіть опорну точку під цей рядок у c і починайте обчислювати моменти відносно цього опорного пункту, і обчислення точно відповідатимуть статистичним моментам.ХнХc

мн(c)=Е[(Х-c)н]
Хc

Велика частина часу, то -го момент X відноситься до моменту навколо 0 (моментів , коли точка опори знаходиться в точці 0): м п = E [ X п ] п -го центральний момент X є: м п = m n ( m 1 ) = E [ ( X - m 1 ) n ]нХ

мн=Е[Хн]
нХ
м^н=мн(м1)=Е[(Х-м1)н]
Це відповідає моментам, коли опорна точка розміщується в центрі маси, тому розподіл збалансований. Це дозволяє простіше інтерпретувати моменти, як ми побачимо нижче. Перший центральний момент завжди буде нульовим, оскільки розподіл збалансований.

-го стандартизовані момент X є: ~ т п = т пнХ Знову ж це масштабує моменти за рахунок поширення розподілу, що дозволяє простіше тлумачити конкретно Куртосіс. Перший стандартизований момент завжди буде нульовим, другий - завжди. Це відповідає моменту стандартної оцінки (z-оцінка) змінної. Я не маю великого фізичного аналога для цієї концепції.

м~н=м^н(м^2)н=Е[(Х-м1)н](Е[(Х-м1)2])н

Поширені моменти

Для будь-якого розподілу потенційно існує нескінченна кількість моментів. Досить моменти майже завжди повністю характеризуватимуть і розподіляти (виведення необхідних умов, щоб це було певним, є частиною проблеми моменту ). Чотири моменти зазвичай багато говорять у статистиці:

  1. Середній - 1-й момент (зосереджений навколо нуля). Він є центром маси розподілу, або, альтернативно, пропорційним моменту крутного моменту розподілу відносно точки опори при 0.
  2. Х
  3. Косоокість - 3-й центральний момент (іноді стандартизований). Міра перекосу розподілу в ту чи іншу сторону. Щодо нормального розподілу (у якого немає перекосу), позитивно перекошений розподіл має низьку ймовірність надзвичайно високих результатів, негативно перекошені розподіли мають малу ймовірність надзвичайно низьких результатів. Фізичні аналоги важкі, але вільно це вимірює асиметрію розподілу. Як приклад наведена нижче цифра взята з Вікіпедії . Skewness, взяті з Вікіпедії
  4. ХКуртоз, також з Вікіпедії

Ми рідко говоримо про моменти поза Куртосом, саме тому, що інтуїція в них дуже мала. Це схоже на зупинку фізиків після другого моменту.


6

Це трохи старий потік, але я хочу виправити неправильне твердження в коментарі Fg Nu, який написав "Моменти параметризовані натуральними числами і повністю характеризують розподіл".

Моменти НЕ повністю характеризують розподіл. Зокрема, знання про всю нескінченну кількість моментів, навіть якщо вони існують, не обов'язково однозначно визначає розподіл.

Згідно з моєю улюбленою книгою ймовірностей, Феллер "Вступ до теорії ймовірностей та її застосувань. Том II" (див. Мою відповідь на прикладах реального життя загальних розподілів ), приклад розділу VII.3 на стор. 227-228, Логоритм не визначається. за його моментами, що означає, що існують і інші розподіли, що мають все нескінченне число моментів, таких самих, як Лонормальне, але різні функції розподілу. Як відомо, функція, що генерує момент, не існує для логістичного, а також для інших розподілів, що мають ті самі моменти.

Х

н=1(Е[Х2н])-1/(2н)

розходиться. Зауважте, що це не "якщо" і "лише". Ця умова не відповідає Лонормальному, і справді вона не визначається його моментами.

З іншого боку, розподіли (випадкові величини), які поділяють всю нескінченну кількість моментів, можуть відрізнятися лише на стільки, через нерівності, які можуть бути отримані з їх моментів.


Це значно спрощується, коли розподіл обмежений, і в цьому випадку моменти завжди визначають розподіл повністю (однозначно).
Алекс Р.

@ Алекс Це негайний наслідок результату, наведеного у Феллера.
whuber

Не зовсім коректно сказати, що функція, що генерує момент, не існує для лонормального. Найбільш корисні теореми про mgf припускають, що вони існують у відкритому інтервалі, що містить нуль, і в строгому сенсі його не існує. Але це існує в промені, що виходить з нуля !, і це також дає корисну інформацію.
kjetil b halvorsen

@ kjetil b halvorsen, чи можете ви описати (якусь частину) корисну інформацію, яку ви отримали від існування MGF лонормального на промені, що виходить з нуля? Який це промінь був би?
Марк Л. Стоун

Bump of top comment as questions to @kjetil b halvorsen ..
Марк Л. Стоун

2

Наслідком зауважень Glen_b є те, що перший момент, середній, відповідає центру ваги для фізичного об'єкта, а другий момент навколо середньої, дисперсії, відповідає моменту інерції. Після цього ви самостійно.


3
Е[х2]=х2f(х)гх vаr[х]=Е[(х-Е[х])2]=(х-Е[х])2f(х)гх.
Захарій Блуменфельд

0

Біноміальне дерево має дві гілки, кожна, мабуть, 0,5. Власне, p = 0,5, а q = 1-0,5 = 0,5. Це генерує нормальний розподіл з рівномірно розподіленою масою ймовірностей.

Власне, ми маємо припустити, що кожен ярус у дереві закінчений. Коли ми розбиваємо дані на бункери, ми отримуємо реальну кількість від поділу, але ми округляємо їх. Ну, це незавершений рівень, тому ми не закінчуємо гістограмою, що наближається до нормальної.

Змініть вірогідність розгалуження на p = 0,9999 і q = 0,0001, і це стане нам косою нормою. Маса ймовірності змістилася. Це пояснює перекос.

Маючи неповні яруси або бункери менше 2 ^ n, генерують двочленні дерева з ділянками, які не мають масової ймовірності. Це дає нам куртоз.


Відповідь на коментар:

Коли я говорив про визначення кількості бункерів, округніть до наступного цілого числа.

Машини Quincunx скидають кульки, які з часом наближають нормальний розподіл через двочлен. На такій машині зроблено кілька припущень: 1) кількість бункерів є кінцевою, 2) базове дерево є двійковим і 3) ймовірності фіксовані. Машина Quincunx в Музеї математики в Нью-Йорку дозволяє користувачеві динамічно змінювати ймовірності. Ймовірності можуть змінюватися в будь-який час, навіть до завершення поточного шару. Звідси ця ідея про заповнення бункерів.

На відміну від того, що я сказав у своїй оригінальній відповіді, коли у вас є порожнеча в дереві, розподіл демонструє куртоз.

Я дивлюся на це з точки зору генеративних систем. Я використовую трикутник, щоб узагальнити дерева рішень. Коли приймається нове рішення, в основу трикутника додається більше бункерів, а щодо розподілу - в хвости. Обрізання підкреслень дерева залишало б порожнечі у масі ймовірності розподілу.

Я лише відповів, щоб дати тобі інтуїтивний сенс. Мітки? Я використовував Excel і грав з ймовірностями у двочленні та генерував очікувані перекоси. Я не робив цього з куртозом, це не допомагає, що ми змушені думати про ймовірнісну масу як про статичну, використовуючи мову, що підказує рух. Основні дані або кулі викликають куртоз. Потім ми аналізуємо його по-різному і приписуємо формувати описові терміни, як центр, плече та хвіст. Єдине, з чим ми маємо працювати - це баки. Бункери живуть динамічним життям, навіть якщо дані не можуть.


2
Це інтригує, але жахливо схематично. Які, наприклад, мітки на вашому двочленному дереві? Якщо ви хочете отримати нормальний розподіл, краще бути нескінченним деревом, але тоді очевидні мітки (використання випадкової ходи або використання двійкових уявлень реальних чисел) взагалі не призводять до нормальних розподілів. Без цих деталей занадто багато залишається читацьким уявам. Чи можете ви детальніше розглянути їх?
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.