Як би ви пояснили миряни функцію генерування моменту (MGF)?


15

Що таке функція генерування моменту (MGF)?

Чи можете ви пояснити це простим та легким прикладом?

Будь ласка, обмежтесь, використовуючи офіційні математичні позначення, наскільки це можливо.


1
Ви хочете простий, простий приклад ... але без математичних позначень? Я не впевнений, що таке зробити було б дуже просто - принаймні, не ризикуючи створити оманливе враження про те, що ти маєш справу. Я припускаю, що можна дати mgf виродженої випадкової величини, яка завжди дорівнює не потребуючи багато в чому математичних позначень, але це буде непросвітно, якщо ви дійсно хочете зрозуміти mgfs. 0
Glen_b -Встановити Моніку

1
Я не впевнений, чи існує інтуїтивний спосіб його розуміння, ви можете просто подумати про це як про спосіб "кодування" розподілу (принаймні, коли він існує, ця ідея працює трохи краще з характерними функціями).
dsaxton

1
Функція, що генерує момент, - коли вона існує - це спосіб кодування всіх невід’ємних цілочисельних моментів випадкової змінної у функцію, з якої вони можуть бути вилучені знову; mgfs можна використовувати для конкретних розрахунків, які іноді не так просто зробити іншими способами. Я не сподіваюся, що це велика допомога.
Glen_b -Встановіть Моніку

1
Я впевнений, що ви бачили, як Джо Бліцштейн відповів на ідентичне запитання щодо Quora
Антоні Пареллада

Відповіді:


18

Припустимо, що інтуїція без рівнянь не можлива, і все ж наполягаємо на тому, щоб збити математику до найважливішого, щоб зрозуміти, що відбувається: ми намагаємося отримати статистичні моменти , які після обов'язкового посилання на фізику , ми визначаємо як очікуване значення потужності випадкової величини. Для безперервної випадкової величини необроблений -й момент - LOTUS :k

(1)E[Xk]=Xkpdfdx

Функція, що генерує момент , - це спосіб обійти цей інтеграл (Eq.1) , замість цього виконуючи:

MX(t):=E[etX],

(2)E[etX]=etXpdfdx

Чому? Тому що це простіше і є фантастичне властивість MGF , що можна побачити, розширивши ряд Маклорена зetX

etX=1+X1!t+X22!t2+X33!t3+

Приймаючи очікування обох сторін цього силового ряду:

MX(t)=E[etX](3)=1+E[X]1!t+E[X2]2!t2+E[X3]3!t3+

моменти з'являються "приземленими" на цій поліноміальній "лінії одягу", готової до вибивання простою диференціацією разів та оцінкою в нуль, як тільки ми проходимо через простішу інтеграцію (в еквіваленті (2)) лише один раз на всі моменти! Той факт, що це легша інтеграція, найбільш очевидний, коли pdf є експоненціальним.k

Для відновлення -го моменту:k

MX(k)(0)=dkdtkMX(t)|t=0

Той факт, що зрештою виникає необхідність розмежувати, робить це не вільним обідом - врешті-решт, це двостороннє перетворення Лапласа pdf із зміненим знаком у експоненті:

L{pdf(x)}(s)=esxpdf(x)dx

такий, що

(4)MX(t)=L{pdf(x)}(s).

Це, по суті, дає нам дорогу фізиці до інтуїції. Перетворення Лапласа діє на і розкладає його на моменти. Схожість з перетворенням Фур'є неминуча : а FT відображає функцію нової функції на дійсній прямій, і Лапласа переводить функцію нової функції на комплексній площині. Перетворення Фур'є виражає функцію або сигнал у вигляді серії частот, тоді як перетворення Лапласа розв'язує функцію на її моменти . Насправді інший спосіб отримання моментів відбувається через перетворення Фур'є ( характерна функція ). Експоненціальний член у перетворенні Лапласа взагалі має вигляд сpdfests=σ+iω , відповідний реальний експонент і уявні sinusoidals і приносять ділянки , такі як це :


[ З посібника вченого та інженера з обробки сигналів Стівена В. Сміта ]


Тому функція розкладає - то в його «складових частот» , колиЗ ек. (4):MX(t)pdfσ=0.

MX(t)=E[esX]=esxpdf(x)dx=e(σ+iω)xpdf(x)dx=eσxeiωxpdf(x)dx

що залишає нам неправильну інтегральну частину виразу червоного кольору, що відповідає перетворенню Фур'є у форматі pdf.

Загалом, інтуїція полюсів перетворення Лапласа функції полягала б у тому, що вони надають інформацію про експоненціальні (занепадуючі) та частотні компоненти функції (в цьому випадку pdf).


У відповідь на запитання під коментарями про перехід від до це абсолютно стратегічний хід: одне вираження не випливає з іншого. Ось аналогія: у нас є власний автомобіль, і ми можемо їхати в місто кожен раз, коли нам потрібно подбати про якусь справу (читайте, інтегруючи Eq незалежно від того, наскільки жорсткий кожен окремий момент) . Натомість ми можемо зробити щось зовсім інше: ми можемо доїхати до найближчої станції метро (прочитати, вирішити еквалайзер лише один раз), а звідти користуватися громадським транспортом, щоб дістатися до кожного місця, яке нам потрібно відвідати (прочитати, дістати будь-який похідне інтеграла в рівнянні для отримання будь-якогоXketx(1)(2)k(2)k-це ми потребуємо, знаючи (завдяки рівнянню ), що всі моменти "ховаються" там і виділяються, оцінюючи ).(3)0


2
Як замінює ? ( E[etX]E[Xk]
Зовнішньо

2
Я бажаю, щоб миряни, які розуміють цю відповідь, були моїми студентами :)
Аксакал,

3

У найпростіших термінах це спосіб кодувати всі характеристики розподілу ймовірностей в одну коротку фразу. Наприклад, якщо я знаю, що MGF розподілу я можу дізнатися середнє значення цього розподілу, взявши перший термін розширення Тейлора : Якщо ви знаєте, що ви робите, це набагато швидше, ніж приймати очікування функції ймовірності.

M(t)=etμ+1/2σ2t2
ddtM(t)|t=0=μ+σ2t|t=0=μ

Більше того, оскільки цей MGF кодує все про розподіл, якщо ви знаєте, як маніпулювати функцією, ви можете застосувати операції з усіма характеристиками розподілу одразу! Чому ми не завжди використовуємо MGF? По-перше, не у всіх ситуаціях MGF - це найпростіший інструмент. По-друге, MGF не завжди існує.

Вище мирянин

Припустимо, у вас є звичайний нормальний розподіл. Ви можете висловити все, що ви знаєте про нього, вказавши його PDF:

f(x)=12πex2/2

Ви можете обчислити його момент, наприклад, середнє та стандартне відхилення, і використовувати його для перетворених змінних та функцій на випадкових нормалах тощо.

Ви можете вважати MGF звичайного розповсюдження як альтернативу PDF. Він містить однаковий обсяг інформації. Я вже показав, як отримати середнє значення.

Навіщо нам потрібен альтернативний спосіб? Як я писав, іноді це просто зручніше. Наприклад, спробуйте обчислити дисперсію стандартного нормального в PDF: Це не так складно, але набагато простіше це зробити з MGF :

σ2=x212πex2/2dx=?
M(t)=et2/2
σ2=d2dt2M(t)|t=0=ddtt|t=0=1


1
Чи можете ви, будь ласка, розширити "все", що кодує щодо дистрибуції?
ColorStatistics

2
Щоб оцінити тему, яку висловили @ColorStatistics, перегляньте сторінку stats.stackexchange.com/questions/25010 .
whuber

@whuber: Дякую, юбе. Я вивчу це посилання. Це тема, яку я хочу зрозуміти краще.
ColorStatistics

Як ми можемо довести, що MGF та PDF містять однаковий обсяг інформації?
Ерін
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.