Я намагаюся зрозуміти логіку d-розділення в причинних байєсівських мережах. Я знаю, як працює алгоритм, але я не точно розумію, чому працює "потік інформації", як зазначено в алгоритмі.
Наприклад, на графіку вище, давайте подумаємо, що нам задано лише X, а іншої змінної не спостерігається. Тоді, згідно з правилами d-поділу, потік інформації від X до D:
X впливає на A, що є . Це нормально, оскільки A викликає X, і якщо ми знаємо про ефект X, це впливає на нашу думку про причину А. Потік інформації.
X впливає на B, що є . Це нормально, оскільки A було змінено нашими знаннями про X, зміна на A може вплинути на наші переконання щодо її причини, B.
X впливає на C, що є . Це нормально, оскільки ми знаємо, що B упереджено нашими знаннями про його непряму дію X, а оскільки B є упередженим X, це вплине на всі прямі та опосередковані наслідки B. C - це прямий ефект B, на нього впливають наші знання про X.
Ну, до цього моменту для мене все гаразд, оскільки потік інформації відбувається відповідно до інтуїтивно зрозумілих причинно-наслідкових зв’язків. Але я не відчуваю особливої поведінки так званих "V-структур" або "Колайдерів" у цій схемі. Відповідно до теорії d-поділу, B і D є загальними причинами С на наведеному вище графіку, і це говорить про те, що якщо ми не спостерігали C або когось із його нащадків, інформація про потік з X блокується при C. Ну, добре , але моє питання чому?
З трьох вищезазначених кроків, розпочатих з X, ми побачили, що на C впливають наші знання про X, а інформаційний потік відбувся відповідно до причинно-наслідкового зв’язку. Теорія d-поділу говорить, що ми не можемо перейти від C до D, оскільки C не спостерігається. Але я думаю, що оскільки ми знаємо, що C є упередженим і D є причиною C, D слід постраждати також, поки теорія говорить про протилежне. Я чітко пропускаю щось у своєму мислення, але не бачу, що це таке.
Тому мені потрібно пояснення, чому потік інформації блокується на C, якщо C не спостерігається.