Яка хороша аналогія для ілюстрації сильних сторін ієрархічних байесівських моделей?


10

Я відносно новачок байєсівської статистики і останнім часом використовую JAGS для побудови ієрархічних байєсівських моделей на різних наборах даних. Хоча я дуже задоволений результатами (порівняно зі стандартними GLM-моделями), мені потрібно пояснити нестатистам, у чому різниця від стандартних статистичних моделей. Особливо, я хотів би проілюструвати, чому і коли HBM працюють краще, ніж простіші моделі.

Була б корисна аналогія, особливо та, яка ілюструє деякі ключові елементи:

  • множинні рівні неоднорідності
  • потреба в більшій кількості обчислень, щоб відповідати моделі
  • можливість витягувати більше "сигналу" з тих же даних

Зауважте, що відповідь справді має бути аналогією, що сприяє людям, що не мають статистики, а не простим і приємним для наслідування прикладом.


4
Класична проблема «восьми шкіл» здається чудовим кандидатом на запровадження НВМ. andrewgelman.com/2014/01/21/…
Sycorax повідомляє про відновлення Моніки

2
@ cafe876. Я не бачу, наскільки байєсівський характер моделювання специфічний для вашої точки зору. Чи справді ваше питання стосується байєсівської ієрархічної моделі? чи просто до ієрархічної моделі?
peuhp

@peuhp, з мого досвіду, байєсівські рамки дозволяють оцінити набагато складніші моделі.
nassimhddd

Відповіді:


3

Я хотів би проілюструвати приклад моделювання, пов’язаного з рівнем раку (як у Джонсона та Альберта 1999). Це торкнеться першого та третього елементу вашого інтересу.
Тож проблема полягає у прогнозуванні захворюваності на рак у різних містах. Скажімо, у нас є дані про кількість людей у ​​різних містах кількість людей, які померли від раку x i . Скажімо, ми хочемо оцінити рівень раку θ i . Існують різні способи їх моделювання, і як ми бачимо проблеми з кожним із них. Ми побачимо, як моделювання герахічних баєсів може подолати певну проблему. 1. Один із способів полягає в тому, щоб робити оцінки окремо, але ми будемо страждати від розрідженої проблеми даних, і це буде недооцінка показників, як для низьких N iNiхiθi
Ni.
2. Ще одним підходом до управління проблемою розріджених даних було б використання однакових для всіх міст та прив’язання параметрів, але це також дуже вагоме припущення. 3. Тож, що можна зробити, це те, що всі θ я подібні певним чином, але також і з міськими варіаціями. Таким чином, можна моделювати таким чином, що всі θ я отримані із загального розподілу. Скажіть x iB i n ( N i , θ i ) і θ iB e t a ( a ,θi
θiθiхiБiн(Ni,θi) Повний спільний розподіл був би тоді p ( D , θ , η | N ) = p ( η ) N i = 1 B i n ( x i | N i , θ i ) B e t a ( θ i | η ) де η = ( a , b ) . Нам потрібно зробити висновок ηθiБета(а,б)
p(D,θ,η|N)=p(η)i=1NБiн(хi|Ni,θi)Бета(θi|η)η=(а,б)ηз даних. Якщо вона затиснута на постійну, то інформація не буде протікати між , і вони будуть умовно незалежними. Але розглядаючи η як невідомі, ми дозволяємо містам з меншими даними запозичити статистичну силу у міст з більшою кількістю даних. Основна ідея полягає в тому, щоб більше байєсів і встановити пріорів на пріори щодо моделювання невизначеності в гіперпараметрах. Це дозволяє в цьому прикладі протікати вплив між θ i 's.θiη
θi


Дякую, це дійсно приємний приклад, однак це не аналогія. Я справді шукаю щось, що можу пояснити нестатисту.
nassimhddd

Я думаю, що обмін та зміни на різних рівнях можуть бути використані для нестатистів.
dksahuji

це правда, але чи не існує простішої історії, щоб проілюструвати це?
nassimhddd

3

Коли ви хворі, ви спостерігаєте симптоми, але те, що ви хочете, це діагноз. Якщо ви не лікар, я думаю, що ви можете просто знайти діагноз, який найкраще відповідає вашим симптомам. Але те, що робить Ph HBM - це переглянути ваші симптоми, їх відносну значущість, те, як вони відповідають / співвідносити ваші різні попередні проблеми зі здоров’ям, проблеми вашої родини, сучасні поширені захворювання та умови навколишнього середовища, вашу слабкість, вашу силу ... а потім він поєднає ці продукти, використовуючи свої знання, щоб оновити те, що він здогадується про ваші стани здоров’я, і поставить вам більш вірогідний діагноз.

Я впевнений, що ця аналогія досягає своєї межі досить скоро, але я думаю, що вона може дати добру інтуїцію того, що можна було б очікувати від ГБМ, чи не так? (і я не знайшов кращого)


Мені подобається ця аналогія! Можливо, розтуліть його трохи, додавши, що може додати, що деякі симптоми мають більш важливий сенс для певних потенційних висновків (результати аналізів крові), ніж інші (іноді болить ліве теля трохи)
MikeP

Гарний приклад ... де я думаю, що це не вистачає, це те, що, здається, мається на увазі, що сила НВМ полягає у доступі до БІЛЬШЕ інформації (історії, сім'ї тощо); хоча я хочу висловити, що HBM є більш досконалим з інформацією про SAME. Чи є спосіб адаптувати свою історію?
nassimhddd

@ cafe876. Думаю, дозвольте мені трохи поміркувати.
peuhp
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.