Чи не має значення напрямок ребер у мережі Байєса?


10

Сьогодні на лекції було заявлено, що напрямок ребер в мережі Байєса насправді не має значення. Вони не повинні представляти причинності.

Очевидно, що ви не можете переключити жоден край в мережі Bayes. Наприклад, нехай з і . Якщо ви переключитесь на , більше не буде ациклічним і, отже, не мережею Байєса. Це, здається, в основному є практичною проблемою, як оцінити ймовірності тоді. На цю справу здається набагато складніше відповісти, тому я пропускаю її.V = { v 1 , v 2 , v 3 } E = { ( v 1 , v 2 ) , ( v 1 , v 3 ) , ( v 2 , v 3 ) } ( v 1 , v 3 ) ( v 3 , v 1 ) GG=(V,E)V={v1,v2,v3}E={(v1,v2),(v1,v3),(v2,v3)}(v1,v3)(v3,v1)G

Це змусило мене задати такі питання, на які я сподіваюся отримати відповіді тут:

  1. Чи можливий будь-який спрямований ациклічний графік (DAG) перевернути всі ребра і все-таки мати DAG?
  2. Припустимо, DAG і дані дані. Тепер побудуємо зворотний DAG . Для обох DAG ми підходимо до відповідних мереж Bayes. Тепер у нас є набір даних, для яких ми хочемо використовувати мережу Bayes для прогнозування відсутніх атрибутів. Чи можуть бути різні результати для обох DAG? (Бонус, якщо ви придумали приклад)Г інвGGinv
  3. Схожий на 2, але простіший: Припустимо, DAG та дані. Ви можете створити новий графік , перевернувши будь-який набір ребер, доки залишається ациклічним. Чи рівнозначні мережі Байєса, якщо мова йде про їх прогнози?G G GGG
  4. Чи отримуємо ми щось, якщо у нас є краї, які представляють причинність?

Відповіді:


6

TL; DR: іноді ви можете зробити еквівалентну байєсівську мережу, повертаючи стрілки назад, а іноді не можете.

Просто повернення напрямку стрілок дає інший спрямований графік, але цей графік не обов'язково є графіком еквівалентної байєсівської мережі, оскільки залежність залежності, представлена ​​графіком зі зворотною стрілкою, може відрізнятися від представленого оригінальним графіком. Якщо графік зі стрілкою із зворотною стрілкою представляє різні відносини залежності, ніж оригінал, в деяких випадках можливо створити еквівалентну байєсівську мережу, додавши ще кілька стрілок для фіксації залежностей, які відсутні у графіку зі зворотною стрілкою. Але в деяких випадках не існує абсолютно рівнозначної байєсівської мережі. Якщо вам потрібно додати кілька стрілок, щоб захопити залежності,

Наприклад, a -> b -> cявляє собою ті ж залежності і незалежності a <- b <- c, що і, такі ж, як a <- b -> c, але не такі самі, як a -> b <- c. Останній графік говорить , що aі cє незалежними , якщо bне спостерігається, але a <- b -> cговорить aі cзалежать в цьому випадку. Ми можемо додати край безпосередньо aдо, cщоб зафіксувати це, але тоді aі cнезалежність, коли bспостерігається, не представлена. Це означає, що існує хоча б одна факторизація, яку ми не можемо використати при обчисленні задніх ймовірностей.

Весь цей матеріал про залежність / незалежність, стрілки та їх переворот тощо, висвітлюється в стандартних текстах байєсівських мереж. Я можу викопати деякі довідки, якщо хочете.

Байєсівські мережі не виражають причинності. Джудея Перл, яка багато працювала над байєсівськими мережами, також працювала над тим, що він називає причинно-наслідковими мережами (по суті, байєсівські мережі, зазначаються причинно-наслідковими зв'язками).


Це дає відповіді на питання (2) та (3). Чи маєте ви також уявлення про питання (1) та (4)? (Так, посилання будуть непогані)
Мартін Тома

(1) Розглянемо протилежне: якщо графік зі стрілкою зі зворотною стрілкою має спрямований цикл, то слідування стрілок навколо циклу назад має бути спрямований цикл у вихідному графіку. (4) Байєсові мережі є ймовірнісними моделями і як такі не представляють причинності. Цілком можливо, що деякі стрілки насправді посилаються на причинно-наслідкові зв’язки, але це втрачено в імовірнісній моделі. Можливо, aпричини b, але a -> bі a <- bоднаково справедливі ймовірнісні моделі.
Роберт Дод'є

Деякі вступні посилання. Коллер та Фрідман: "Імовірнісні графічні моделі". Коуелл, Давід, Лауріцен і Шпігельхальтер: "Імовірнісні мережі та експертні системи". Кастільо, Гутьєррес та Хаді: "Експертні системи та ймовірнісні моделі мережі".
Роберт Дод'є

Ви можете перевернути будь-яку стрілку і отримати еквівалентну мережу Bayesian до тих пір, поки не будете тримати v-структури (не
поверніть

1

Це може бути трохи незадовільним, тому не соромтеся не приймати цю відповідь та заздалегідь вибачтесь.

У мережі Байєса вузли представляють випадкові величини, а ребра - умовні залежності. Коли ви інтерпретуєте вузли певним чином, кондиціонування певним чином протікає природним шляхом. Довільно їх реверсування насправді не має сенсу в контексті моделювання даних. І багато часу стрілки представляють причинність.


1
Це досить далеко від позначки. "Природна" інтерпретація - це щось, що нав'язується моделі, не є частиною самої моделі. Ви можете повернути залежності (додавши додаткові ребра за необхідності для збереження набору залежностей, представлених мережею), і це все-таки байєсівська мережа. Чи має сенс це не відповідає, вивчаючи лише саму мережу. Між іншим, Джудея Перл, одна з найбільших рушій байєсівських мереж у 80-х та 90-х, останнім часом працює над офіційними моделями причинності, які виражають причинно-наслідкові зв’язки в моделі.
Роберт Дод'є

Ви кажете: "чи має сенс це не відповідати, вивчаючи лише саму мережу". Я ніколи не казав, що це було. Я сказав: "коли ти інтерпретуєш вузли певним чином, кондиціонування протікає певним чином ..." Це, мабуть, відображає мою упередженість; Ви можете назвати речі, над якими я працюю в мережі Bayes, але це питання ніколи не виникне для мене. Наприклад, якщо два вузли представляють одну і ту ж змінну в різний час, не виникало б питання про те, в якому напрямку тече кондиціонер. Я погоджуюся з можливістю, що бувають ситуації, коли люди можуть використовувати ці мережі Бає менш жорстким способом.
Тейлор

0

Питання 3

synergy.st-andrews.ac.uk/vannesmithlab стверджує, що графіки

G1 = o->o->o and
G2 = o<-o->o

знаходяться в одному класі еквівалентності. Відповідно до цього джерела, моделі представляють точно такий же спільний розподіл ймовірностей.


Це не може бути правильним. Для G1 перший і останній залежать за відсутності будь-яких відомих значень. Для G2 перший і останній не залежать від відсутності відомих значень. Ви мали намір написати G2 = o <- o -> oзамість цього? У всякому разі, я не бачу претензій щодо тих графіків на веб-сторінці, на яку ви посилалися; можливо, ви можете бути більш конкретними.
Роберт Дод'є
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.