Який взаємозв'язок між розміром вибірки та впливом попереднього на заднє?


17

Якщо у нас невеликий розмір вибірки, чи вплине попередній розподіл на задній розподіл сильно?


5
Інтуїція зрозуміла: чим більше у вас даних, тим менше доведеться покладатися на своїх пріорів. Не просто урок статистики, а життєвий урок! ;)
Лукас Рейс

Відповіді:


27

Так. Задній розподіл для параметра , заданий набором даних може бути записаний якXθX

p(θ|X)p(X|θ)likelihoodp(θ)prior

або, як це частіше відображається в масштабі журналу,

log(p(θ|X))=c+L(θ;X)+log(p(θ))

Логарифмічна функція правдоподібності, L(θ;X)=log(p(X|θ)) , ваги з розміром вибірки , оскільки вона є функцією від даних, тоді як попередня щільність не робить. Отже, зі збільшенням розміру вибірки абсолютне значення L(θ;X) збільшується, поки log(p(θ)) залишається фіксованим (для фіксованого значення θ ), таким чином сума L(θ;X)+log(p(θ)) стає більш сильним впливом L(θ;X) зі збільшенням розміру вибірки.

Тому безпосередньо відповісти на ваше запитання - попередній розподіл стає все менш актуальним, оскільки він переважає ймовірність. Отже, для невеликого розміру вибірки попередній розподіл відіграє значно більшу роль. Це узгоджується з інтуїцією, оскільки, ви б очікували, що попередні технічні характеристики відіграватимуть більшу роль, коли не буде великої кількості даних, щоб спростувати їх, тоді як, якщо розмір вибірки дуже великий, сигнал, присутній у даних, буде переважувати будь- який апріор переконання були закладені в модель.


6
+1 Зауважте, що також залежить від . ncn

20

Ось спроба проілюструвати останній абзац у відмінній (+1) відповіді Макрона. Він показує два пріори для параметра у розподілі . Для кількох різних задні розподіли відображаються, коли спостерігається . У міру зростання обидва плакати стають все більш і більше зосередженими навколо .Б я н о м я л ( п , р ) п х = п / 2 п 1 / 2pBinomial(n,p)nx=n/2n1/2

Для різниця досить велика, але для різниці практично немає.n=2n=50

Два приори нижче: (чорний) та (червоний). Плакати мають ті ж кольори, що і пріорі, з яких вони походять.Beta(1/2,1/2)Beta(2,2)

Задні розподіли

(Зверніть увагу, що для багатьох інших моделей та інших пріорів, буде недостатньо для попереднього, що не має значення!)n=50


4
Дуже круті ілюстрації, @ MånsT. Я скасував курсивом слова "Beta" та "Binomial" у вашій відповіді.
Макрос

Звичайно, ні, @Macro! Я погоджуюсь, що так виглядає краще.
MånsT
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.