Малювання зразків з кінцевої суміші нормальних розподілів?


10

Після деяких баєсівських кроків оновлення мені залишається задній розподіл форми суміші звичайних розподілів,Тобто параметр \ theta виводиться з розподілу, PDF якого подається у вигляді зваженої суміші звичайних PDF-файлів, а не є сумою нормальних RV. Я хотів би намалювати зразки \ theta \ sim \ Pr (\ theta | \ text {data}), щоб використовувати для наближення вибіркової важливості цю задню частину. На практиці сума над i може мати велику кількість термінів, так що непрактично вибрати термін i відповідно до ваг \ {w_i \}, а потім намалювати \ theta \ sim N (\ mu_i, \ sigma ^ 2)

Пр(θ|дані)=i=1кшiN(мкi,σ2).
θθПр(θ|дані)ii{шi}θN(мкi,σ2). Чи є ефективний спосіб нанесення зразків із задньої частини цієї форми?

Ви справді спробували метод select then кинути? Вибір може бути зроблений досить швидко з кроків O (k).
dmckee --- кошеня колишнього модератора

1
Якщо рішення Баррона насправді невірно, а ви насправді маєте на увазі "модель суміші", чи можете ви використати цей термін?
Ніл Г

1
Ніл G: Я не статистик з питань торгівлі, а фізик, якому іноді потрібно використовувати статистику. Як такий, я не знав відповідного терміна, щоб описати, що мені потрібно. Я можу продовжити і відредагувати це питання зараз, щоб зробити більш зрозумілим, що PDF-файли підсумовуються, а не RV.
Кріс Гранаде

1
@ChrisGranade: Я не намагався зійти на тебе. Я просто хотів переконатися, що це ви мали на увазі, і запропонувати редагувати.
Ніл G

1
Чому недоцільно вибирати на основі ваг та вибірки з рівномірного розподілу на , а потім вибірку ? Це лише помірно дорожче, ніж вибірка одного нормального розподілу, вартість не залежить від кількості змішаних розподілів і не покладається на те, що такі розподіли є нормальними. { w i } [ 0 , 1 ] N ( μ i , σ 2 ) ki{шi}[0,1]N(мкi,σ2)к
Джед Браун

Відповіді:


6

В принципі, можна було попередньо вибрати кількість зразків, які слід взяти з кожного підрозділу, а потім відвідати кожен підрозділ лише один раз і отримати кількість балів.

Це є

  1. Знайдіть випадкову множину таку, що n = k i = 1 n i та дотримуючись ваг.<n1,n2,,nk>n=i=1kni

    Я вважаю , що це можна зробити, спираючись розподілу Пуассона поліноміальний розподіл (див коментарів) від середньої для кожного суб-розподілу , а потім нормалізує суму в п .winn

    Робота тут O(k)O(n)

  2. Тоді робіть

    for (i=1; i<=k; ++i)
       for (j=1; j<=n[i]; ++j)
          theta ~ N(mu[i],sigma[i])
    

    Робота тут O(n)

Хоча це означає, що ви не отримуєте це у випадковому порядку. Якщо потрібен випадковий порядок, ви повинні перетасувати малюнки (також великі ).O(n)

Схоже, перший крок - це домінування в часі виконання та в тому ж порядку, що й наївний алгоритм, але якщо ви впевнені, що всі ви могли б наблизити розподіли Пуассона до нормальних розподілів і прискорити перший крок.win1


Розподіл є не розподілом Пуассона, якщо n є фіксованим, а біноміальним. nin
Фредерік Гроссханс

@ FrédéricGrosshans Uhm ... ось де я визнаю свою неприємну слабкість у ймовірності. Дивлячись, я думаю, ти можеш мати рацію. У мене немає посилання на кидання довільних біноміальних розподілів, але у wikipedia є деякі посилання . Існує також взаємозв'язок між Пуассоном та Біноміалом, і я, як я стверджую, відповідав за мою невизначеність. Так, це квиток.
dmckee --- колишнє кошеня модератора

1
@dmckee: Гарна відповідь для малювання із сумішальної моделі, за винятком того, що це повинен бути мультиноміальний розподіл, а не розподіл Пуассона на етапі 1.
Ніл G

3

Примітка: в оригінальній версії цього питання було задано питання про "зважену суму нормальних розподілів", на яку може бути корисна наступна відповідь. Однак, після гарного обговорення цієї відповіді, відповіді @Geoff, і на самому питанні, стало зрозуміло, що питання справді полягає у вибірці "суміші нормальних розподілів", до якої ця відповідь не застосовується.


Сума нормальних розподілів - це нормальний розподіл, тож ви могли обчислити параметри цього єдиного розподілу, а потім просто намалювати з нього вибірки. Якщо називати цей розподіл то,N(мксум,σсум2)

мксум=i=1кшiмкi

σсум2=i=1кшi2σi2

3
Якщо коротко сказати, Кріс підсумовує функції щільності ймовірності, а не випадкові величини.
Джефф Оксберрі

2
Кріс хоче PDF, який має (принаймні в принципі) кілька ударів у ньому. Тобто він був сумою PDF-файлів, а не PDF-сумою.
dmckee --- кошеня колишнього модератора

1
Це правда, що сума нормально розподілених випадкових величин сама по собі є нормально розподіленою випадковою змінною. Однак сума нормальних розподілів не є нормальним розподілом. Отже, якщо і X 2N ( μ 2 , σ 2 2 ) , то правда, що X 1 + X 2N ( μ 1 + μ 2 , σ 2 1X1N(μ1,σ12)X2N(μ2,σ22) , але P D F ( X 1 + X 2 ) P D F ( X 1 ) + P D F ( X 2 ) . (Кредит надходить до @ChrisGranade для пояснення.)X1+X2N(μ1+μ2,σ12+σ22)PDF(X1+X2)PDF(X1)+PDF(X2)
Джефф Оксберрі

2
@dmckee: це не "зважена сума нормальних розподілів", це "суміш нормальних розподілів".
Ніл Г

2
Коментари @Barron не вважаються важливою частиною сторінки. Ви обов'язково слід відредагувати свою відповідь, щоб включити суть коментарів, щоб читачі, які не дивляться на коментарі, не вводили в оману.
Девід Кетчесон

2

Оновлення : ця відповідь невірна, пов'язана з плутаниною в термінології (детальніше див. Ланцюжок коментарів нижче); Я залишаю це лише як орієнтир, щоб люди не репостували цю відповідь (окрім Баррона). Будь ласка, не голосуйте ні вгору, ні вниз.

X1N(μ1,σ12)X2N(μ2,σ22)

X1+X2N(μ1+μ2,σ12+σ22).

w1R

w1X1N(w1μ1,w12σ12).

Використовуючи ці два результати разом, тоді

Pr(θ|data)N(i=1kwiμi,i=1kwi2σi2).

Тож у цьому випадку вам потрібно буде лише витягувати зразки з одного розподілу, що має бути набагато більш простежуваним.


2
Це рішення іншої проблеми, яку видно з того, що оригінальний розподіл є мультимодальним, а ваша пропозиція - одномодальним.
Кріс Феррі

@ChrisFerrie: Я вірю вам, але, виходячи з позначень, я плутаюсь, чому розподіл вище був би мультимодальним, тоді як сума двох незалежних гауссових випадкових величин не була б. Що я тут пропускаю?
Джефф Оксберрі

p(X1+X2)p(X1)+p(X2)i

Ах, ви переглядаєте суми PDF-файлів. Так, це зовсім інший звір. Тепер, коли я читаю питання більш уважно, я бачу, що ви говорите, і я збираюся видалити свою відповідь. Дякую!
Джефф Оксберрі

Я скасував свою попередньо видалену відповідь лише для того, щоб служити орієнтиром для інших, щоб ніхто більше не відповідав на це запитання, як ми з Барроном. Будь ласка, більше не голосуйте за мою відповідь.
Джефф Оксберрі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.