Якщо я фіксую значення спостережуваних вузлів MRF, чи стає це CRF?
Якщо я фіксую значення спостережуваних вузлів MRF, чи стає це CRF?
Відповіді:
Гаразд, я сама знайшла відповідь:
Умовні випадкові поля (CRF) є особливим випадком випадкових полів Маркова (MRFs).
1.5.4 Умовне випадкове поле
Умовне випадкове поле (CRF) - це форма MRF, яка визначає задню для змінних x заданих даних z, як і прихований MRF вище. Однак, на відміну від прихованого МРП, факторизація розподілу даних P (x | z) та попереднього P (x) не робиться явною [288]. Це дозволяє записувати складні залежності x на z безпосередньо в задньому розподілі, не роблячи явного пояснення. (Враховуючи P (x | z), такі факторизації завжди існують, однак - насправді їх нескінченно багато - тому немає припущення, що КРФ є загальнішим, ніж прихований ДПС, тільки щоб з ним було зручніше поводитися .)
Джерело: Блейк, Колі та Ротер: Маркові випадкові поля для зору та обробки зображень. 2011 рік.
Умовне випадкове поле або CRF (Lafferty et al. 2001), іноді дискримінаційне випадкове поле (Kumar and Hebert 2003), є лише версією MRF, де всі потенціали кліку обумовлені особливостями введення: [...]
Перевага CRF над MRF є аналогічною перевазі дискримінаційного класифікатора перед генеративним класифікатором (див. Розділ 8.6), а саме нам не потрібно «витрачати ресурси», моделюючи речі, які ми завжди спостерігаємо. [...]
Недоліком КРС в порівнянні з ДПС є те, що вони вимагають мічених даних про навчання, і вони повільніше навчаються [...]
Джерело: Кевін П. Мерфі: Машинне навчання: ймовірнісна перспектива
Відповідаючи на моє запитання:
Якщо я фіксую значення спостережуваних вузлів MRF, чи стає це CRF?
Так. Закріплення значень те саме, що обумовлюється на них. Однак слід зазначити, що в тренуванні є і відмінності.
Перегляд багатьох лекцій про PGM (імовірнісні графічні моделі) на курсах мені дуже допоміг.
Мережі ДПС проти Байєса : недоброзичливо (але зазвичай) , існує два типи графічних моделей: непрямі графічні моделі та спрямовані графічні моделі (ще один тип, наприклад, граф Таннера). Перший також відомий як Марківські випадкові поля / Марківська мережа та пізніші мережі Байєса / Баєсова. (Іноді припущення про незалежність в обох можуть бути представлені хордальними графіками)
Марков має на увазі те, як він факторизує і означає випадкове поле певний розподіл між тими, що визначені непрямою моделлю.
CRF MRF : Коли спостерігаються деякі змінні, ми можемо використовувати те саме непряме представлення графіків (як і непряме графіки) та параметризацію для кодування умовного розподілу де - набір цільових змінних, а - a (неперервно) ) набір спостережуваних змінних.
І єдина відмінність полягає в тому, що для стандартної мережі Маркова термін нормалізації становить сумму над X і Y, а для CRF термін становить лише Y.
Довідка:
Давайте порівняємо умовні умовиводи в MRF з моделюванням за допомогою CRF, зупинившись на визначеннях по дорозі, а потім вирішимо вихідне питання.
Маркове випадкове поле (MRF) щодо графа є
Оскільки ПДР являє собою спільний розподіл по багатьох змінних, що підкоряються обмеженням Маркова, то ми можемо обчислити умовні розподіли ймовірності за даними спостережуваних значень деяких змінних.
Наприклад, якщо у мене спільний розподіл на чотири випадкові змінні: IsRaining, SprinklerOn, SidewalkWet і GrassWet, то в понеділок я можу захотіти зробити спільний розподіл ймовірностей щодо IsRaining та SprinklerOn, враховуючи, що я спостерігав SidewalkWet = False і GrassWet = Правда. У вівторок я, можливо, захотів би зробити спільний розподіл ймовірностей щодо IsRaining та SprinklerOn, враховуючи, що я спостерігав SidewalkWet = True та GrassWet = True.
Іншими словами, ми можемо використовувати ту саму модель ДПС, щоб робити висновки в цих двох різних ситуаціях, але ми б не говорили, що ми змінили модель. Насправді, хоча ми спостерігали SidewalkWet і GrassWet в обох описаних тут випадках, сам MRF не має "спостережуваних змінних" - самі по собі всі змінні мають однаковий статус в очах ДПС, тому MRF також моделює, наприклад, спільний розподіл SidewalkWet та GrassWet.
На відміну від цього, ми можемо визначити умовне [Маркове] випадкове поле (CRF) щодо графа як
позначає підмножину змінних як "спостережувані"
визначає лише умовне розподіл на неспостережувані задані спостерігаються змінні; він не моделює ймовірність спостережуваних змінних (якщо розподіли виражаються через параметри, це часто сприймається як користь, оскільки параметри не витрачаються на роз'яснення ймовірності речей, які завжди будуть відомі)
Окрім потенційної економії параметрів моделі, збільшення виразності умовної моделі та збереження ефективності виведення, остаточним важливим моментом щодо рецепту CRF є те, що для дискретних моделей (і великого підмножини недискретних моделей), незважаючи на Виразність сімейства CRF, імовірність журналу може бути виражена опуклою функцією параметрів функції, що дозволяє здійснювати глобальну оптимізацію з градієнтом.
Дивіться також: оригінальний crf-папір та цей підручник