Маючи сполучник перед: Глибока властивість чи математична аварія?


21

Деякі дистрибутиви мають сполучені пріори, а деякі -. Це розрізнення лише випадковість? Тобто ви займаєтесь математикою, і це працює так чи інакше, але це насправді не говорить вам нічого важливого про розподіл, крім самого факту?

Або наявність чи відсутність сполучників попередньо відображає якусь глибшу властивість розподілу? Чи поділяються дистрибутиви зі спорідненими пріорами якісь інші цікаві властивості чи властивості, яких відсутні в інших дистрибутивах, що спричиняє ці розподіли, а не інші, попередньо пов'язані?


3
Ну, ви повинні знати, що будь-яке розповсюдження, яке можна записати як члена звичайної експоненціальної сім'ї, повинно мати попереднє сполучення.

Чи знаємо ми про будь-який цікавий клас розподілів, який, безумовно, показав, що не має сполучених пріорів? Я знаю дуже мало дистрибутивів з 3 і більше параметрами, які мають відомі CP, але я не впевнений, чи знаємо ми, що їх не існує, або просто знаю, що ми їх не знайшли.
andrewH

1
Цікаво. Це можна розглядати як властивість оператора, що транспортує до заднього, в тому ж параметричному сімействі. Що ще цікавіше, це може розглядатися як властивість закриття триплета (попередній розподіл, вибірковий розподіл, оператор оновлення Bayes).
JohnRos

@JohnRos. Мені подобається те, як ти думаєш.
andrewH

Стосовно вашого вступного твердження, будьте обережні з тривіальним випадком пріорів, які ставлять всю масу в одне значення простору параметрів (не дуже корисно для виводу, так?) Теорема Байєса показує, що це сполучені пріори для кожної моделі. Звичайно, вони представляють попереднє знання когось із "фіксованими ідеями".
Дзен

Відповіді:


7

Це не випадково. Тут ви знайдете короткий дуже приємний огляд щодо споріднених пріорів. Конкретно, він згадує, що якщо існує набір достовірних статистичних даних фіксованого розміру для заданої функції вірогідності, то ви можете побудувати до неї кон'югат. Наявність набору достатньої статистики означає, що ви можете факторизувати ймовірність за формою, яка дозволяє оцінювати параметри в обчислювально ефективній формі.

Крім того, мати спільні пріори - це не тільки зручно в обчисленні. Він також забезпечує згладжування і дозволяє працювати з дуже невеликими зразками або відсутністю попередніх зразків, що необхідно для таких проблем, як прийняття рішень, у випадках, коли у вас є дуже мало доказів.


2

Я дуже новачок у баєсівській статистиці, але мені здається, що всі ці розподіли (а якщо не всі, то принаймні ті, що корисні) поділяють властивість, яку вони описують деякою обмеженою метрикою щодо спостережень, що їх визначають . Тобто, для нормального розподілу вам не потрібно знати кожну деталь про кожне спостереження, а лише їх загальну кількість та суму.

Інакше кажучи, якщо припустити, що ви вже знаєте клас / сімейство розповсюдження, то дистрибуція суворо нижча інформаційна ентропія, ніж спостереження, що призвели до цього.

Це здається тривіальним, чи це щось на зразок того, що ви шукаєте?


1

Які властивості "глибокі" - дуже суб'єктивне питання! тому відповідь залежить від вашої концепції "глибокого". Але, якщо мати споріднені пріори є "глибоким" властивістю, в якомусь сенсі, то це значення є математичним, а не статистичним. Єдиною причиною того, що (деякі) статистики зацікавлені у суміжних пріорах, - це те, що вони спрощують деякі обчислення. Але це менш важливо для кожного дня, який проходить!

 EDIT

Спроба відповісти на коментар @whuber нижче. По-перше, відповідь потрібно запитати точніше, що таке споріднена родина пріорів? Це означає сімейство, яке закрите під час відбору проб, тому (для даної моделі вибірки) попередній та задній розподіли належать одній родині. Це явно справедливо для родини всіх розповсюджень, але ця інтерпретація залишає питання без змісту, тому нам потрібна більш обмежена інтерпретація. Фуртех, як вказував Diaconis & Ylvisaker , для біноміальної моделі, якщо допустимо - обмежену позитивну функцію на а - бета-щільність, то[ 0 , 1 ] f ( p ; α , β ) h ( p ) f ( p ; α , β )год[0,1]f(p;α,β)год(p)f(p;α,β)є кон'югатом-попередником. Він не має деяких властивостей звичайного бета-кон'югату попереднього, але сім'я, яку він генерує, закрита під час відбору проб, тому попередньо кон'югат має місце. Ми не отримуємо приємних закритих формул, але нам потрібна лише одна числова інтеграція, щоб отримати константу нормалізації.

Тепер звичайна бета-попередня щільність має ще одне важливе властивість: заднє очікування є лінійною функцією: (для деяких ). Відповідна властивість стосується "звичайних" споріднених пріорів у експоненціальних сім'ях, див. Diaconis & Ylvisaker . Тож у цьому сенсі звичайні сім’ї сполучників грають роль у байєсівській статистиці, подібній теоремі Гаусса-Маркова в класичній статистиці (див. Роль теореми Гаусса-Маркова в лінійній регресії ): це обгрунтування лінійних методів.a,b

Е{Е(θХ=х)}=ах+б
а,б

Існує також інша точка зору, що веде до звичайних суміжних сімей. Якщо ми вважаємо попередню інформацію такою, що представляє інформацію з деяких попередніх даних (з того самого сімейства розподілу вибірки), то ми могли б включити цю інформацію як функцію попередньої ймовірності . Тоді ми могли б отримати комбіновану функцію ймовірності, помноживши попередню ймовірність на ймовірність даних. Натомість ми можемо вибрати представлення попередньої інформації за допомогою попереднього розповсюдження, "звичайний" кон'югат попереднього - це вибір, який дає пропорційний комбінованій ймовірності вище. Дивіться https://en.wikipedia.org/wiki/Conjugate_prior, де дана інтерпретація використовуєтьсядо×ймовірністьпопередні інтерпретації даних параметрів у перерахованих (звичайних) родинах сполучених груп.

Отже, підсумовуючи, звичайні споріднені сім’ї в експоненціальних родинах можуть бути виправдані як пріори, що ведуть до лінійних методів, або як пріори, що походять від представлення попередніх даних. Сподіваюся, ця розширена відповідь допомагає!


2
Це дійсно коментар, а не відповідь, @kjetil. Це слід розробити у відповідь або перетворити на коментар.
gung - Відновити Моніку

4
@gung Я не хочу перетворювати цю відповідь у коментар, тому що, здається, її можна інтерпретувати як відповідь: вона стверджує, що існування попереднього сполучника має мало значення, крім спрощення обчислень. (Я вважаю, що можуть бути причини, щоб заперечити справедливість цього твердження, але бути невірним - це не те, що не відповісти!)
whuber

@whuber: про які причини, крім обчислювальної простоти, ти думаєш? Я спробую розширити на anserv ...
kjetil b halvorsen

1
Оскільки чітке математичне формулювання взаємозв'язку - це те, що можна проаналізувати та зрозуміти, тоді як простий обчислювальний результат - це саме такий результат - результат, який зазвичай не дає узагальнюючого розуміння. Це подібно до різниці між наявністю карти країни, з якої можна вивчити та вивчити, порівняно з GPS-пристроєм, що використовує голос, який дасть вказівки щодо водіння. Обидва отримають вас від однієї точки до іншої, але перша розповість вам набагато більше про місце, через яке ви їдете.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.