Як встановити приблизний PDF (тобто: оцінювання щільності), використовуючи перші k (емпіричні) моменти?


11

У мене є ситуація, коли я в змозі оцінити (перші) моменти набору даних, і хотів би використовувати його для оцінки функції функції щільності.k

Я вже натрапив на розподіл Пірсона , але зрозумів, що він покладається лише на перші 4 моменти (з деякими обмеженнями на можливі поєднання моментів).

Я також розумію, що будь-якого обмеженого набору моментів недостатньо, щоб "закріпити" певний розподіл, коли не використовуються більше припущення. Однак я все ж хотів би більш загального класу дистрибуцій (крім сімейства дистрибуцій Pearson). Дивлячись на інші запитання, я не зміг знайти такого розподілу (див .: тут , тут , тут , тут , тут і тут ).

Чи є якесь ("просте") узагальнене сімейство розподілу, яке можна визначити для будь-якого набору моментів? (можливо, набір перетворень, який може приймати стандартний нормальний розподіл і перетворює його, поки він не підтвердиться з усім набором k моментів)kk

(Мені не дуже важливо, якщо вважати, що інші моменти 0 або ні)k+1

Дякую.

ps: Я був би радий широким прикладом. Переважно з прикладом коду R.


2
kkE[Xk]=(i)kϕX(k)(0)k

Дякую @StephanKolassa - будь-який шанс на розширену відповідь / приклад коду R?
Тал Галілі

2
en.wikipedia.org/wiki/Maximum_entropy_probability_distribution пропонує загальний метод.
whuber

Шановний @whuber, ви можете запропонувати приклад коду R? (також, чи йде це на відповідь волфів?)
Тал Галілі

Це зовсім інший підхід від цієї відповіді.
whuber

Відповіді:


11

Спосіб 1: Системи Пірсона вищого порядку

p(x)

dp(x)dx=(a+x)c0+c1x+c2x2p(x)

(a,c0,c1,c2)

c0+c1x+c2x2p(x)

dp(x)dx=(a+x)c0+c1x+c2x2+c3x3p(x)

який дає рішення:

введіть тут опис зображення

Я вирішив це для задоволення деякий час назад (маючи такий самий мислительний потяг, як і ОП): виведення та рішення наведено у главі 5 нашої книги; Якщо ви зацікавлені, безкоштовне завантаження доступне тут:

http://www.mathstatica.com/book/bookcontents.html

Зауважте, що, хоча сім'я Пірсона другого порядку може бути виражена у перших 4 моменти, сім'я Пірсона третього порядку потребує перших 6 моментів.

Спосіб 2: Розширення Грама-Чарлі

kth

Моменти населення чи вибіркові моменти ??

Для системи в стилі Пірсона: Якщо моменти населення відомі, то використання більш високих моментів повинно однозначно забезпечити кращу форму. Однак, якщо спостережувані дані є випадковою вибіркою, отриманою з сукупності, відбувається компроміс: поліном вищого порядку означає, що потрібні моменти вищого порядку, і оцінки останнього можуть бути недостовірними (мати велику дисперсію), якщо тільки розмір вибірки не є "великим". Іншими словами, з огляду на вибіркові дані, пристосування з використанням більш високих моментів може стати «нестабільним» і дати менші результати. Те ж саме стосується розширень Gram-Charlier: додавання додаткового терміна може насправді отримати гірший підхід, тому потрібно певний догляд.


Шановний @wolfies - дякую за вашу відповідь! Якщо я вас правильно зрозумів, розширення Грам-Чарлі більше відповідають тому, що я шукаю (хоча про більш узагальнену дистрибуцію Пірсона цікаво знати). Я переглянув вашу книгу (глава 5, починаючи зі сторінки 175), і бачу, як ви дійсно даєте там детальний опис (із зазначенням того, як поводитися з передбачуваними моментами, що є моїм випадком). Єдине, що я не можу використовувати ваш код (оскільки я користувач R). Дякую за вашу відповідь (а також за вашу книгу, яка загалом здається вражаючою та цікавою)
Тал Галілі

2
Щойно знайшли пакет R для боротьби з різними методами: cran.us.r-project.org/web/packages/PDQutils/vignettes/…
Тал Галілі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.