Прихована модель Маркова проти моделі переходу Маркова проти моделі держави-простору…?

Для своєї магістерської роботи я працюю над розробкою статистичної моделі переходів між різними станами, визначеної серологічним статусом. Поки що я не буду занадто багато деталей давати в цьому контексті, оскільки моє питання є більш загальним / теоретичним. У будь-якому випадку, моя інтуїція полягає в тому, що я повинен використовувати модель прихованого Маркова (HMM); Проблема, з якою я стикаюся під час перегляду літератури та інших фонових досліджень, необхідних для формування моєї моделі, - плутанина щодо термінології та точні відмінності між різними типами прихованих процесів. Я лише дуже розпливчасто усвідомлюю, що їх відрізняє (приклади в майбутньому). Далі, мені здається, що, принаймні з того, що я бачив у літературі, існує дуже нестандартна лексика, складена навколо цього типу моделювання,

Отже, я сподівався, що люди можуть допомогти мені розрізнити деякі з цих термінів для мене. У мене є ряд запитань, але я здогадуюсь, що як відповідь на одного чи двох задовільний, в результаті решта стане роз'єднана. Я сподіваюся, що це не надто довгодушно; якщо модератор хоче, щоб я розділив це на кілька постів, я буду. У будь-якому випадку, я поставив свої питання жирним шрифтом, а потім - деталі запитання, яке я розкрив під час пошуку літератури.

Отже, у жодному конкретному порядку:

1) Що саме є "прихованою моделлю процесу"?

Я працював під враженням, що "модель прихованого процесу" є свого роду парасольковим терміном, який може бути використаний для опису декількох різних типів статистичних моделей, всі по суті імовірнісні описи даних часових рядів, що генеруються "системою перекриття, потенційно приховані, лінійно-адитивні процеси "([1]). Дійсно, [2] визначає "модель прихованого процесу" як "загальний термін, що стосується або моделі простору стану, або прихованої моделі Маркова". [1], схоже, випливає, що прихована модель Маркова є підтипом прихованих процесових моделей, спеціально спрямованих на висновок про бінарні стани; основний висновок мені здається, що прихована модель процесу - це узагальнення прихованої моделі Маркова. Я іноді бачу "приховану модель процесу" І фразу "

Чи правильна ця інтуїція з мого боку? Якщо ні, чи хтось має посилання, яке більш чітко розмежовує ці методи?

2) Чим відрізняється модель прихованого Маркова від моделі простору стану?

Знову повертаючись до [2] (хоча б тому, що папір має чіткий словник термінів, а не тому, що сама папір видається особливо авторитетною; це просто зручне джерело однозначних визначень), різниця здається в тому, що модель прихованого Маркова - це специфічний тип моделі простору станів, в якому штати є марківськими (не здається, що існує певне обмеження порядку марківського процесу; тобто першого порядку, ..., k-го порядку). Тут модель простору станів визначається як "Модель, яка паралельно виконує два часові ряди, один фіксує динаміку справжніх станів (прихованих), а інший складається із спостережень, які зроблені з цих базових, але можливо невідомих станів". Якщо ці держави також демонструють власність Маркова, то це прихована модель Маркова.

Однак [3] визначає різницю між моделями стану та простору прихованими моделями Маркова як пов'язані з характеристиками прихованого стану. Тут модель прихованої Маркова має справу з дискретними станами, тоді як моделі простору станів стосуються суцільних станів; в іншому випадку вони концептуально однакові.

Мені здається, це два дуже різні визначення. Під однією моделлю «Прихована Маркова» є підтипом державно-просторової моделі, тоді як під іншою вони є просто різними інстанціями більш широкого класу прихованих процесових моделей. Що з них правильне? Моя інтуїція вказує на мене слідувати [3] на відміну від [2], але я не можу знайти авторитетного джерела, яке це підтримує.

3) Що таке "Маркова перехідна модель"?

Ще один термін, який з’явився у численних джерелах, - «Маркова перехідна модель». Я не зміг знайти цю фразу в жодному підручнику, але в статтях журналу вона з’являється дуже багато (просто підключіть її до Google для підтвердження). Я не зміг знайти чітке визначення цього терміна (кожен документ, який я знайду, цитує інший папір, який цитує інший і т.д., посилаючи мене в кролячу дірку PubMed, яка нікуди не веде). Моє враження з контексту полягає в тому, що це дуже загальний термін для позначення будь-якої моделі, в якій об'єктом умовиводу є переходи між станами, які слідують за процесом Маркова, і що приховану модель Маркова можна вважати специфічним типом перехідної моделі Маркова . [4], однак, схоже, використовується перехідна модель, прихована модель Маркова та кілька подібних термінів взаємозамінно.

З іншого боку, [5] говорить про моделі переходу Маркова та приховані моделі Маркова дещо інакше. Автори констатують: "Перехідні моделі забезпечують метод узагальнення динаміки респондентів, який є корисним для інтерпретації результатів більш складних прихованих моделей Маркова". Я не зовсім розумію, що вони розуміють під цією фразою, і не можу знайти виправдання для цього в інших місцях статті. Однак, мабуть, мається на увазі, що Марковські перехідні моделі використовують час як безперервну змінну, тоді як приховані Маркові моделі використовують час як дискретна змінна (вони прямо цього не говорять; вони кажуть, що вони використовують пакет "msm" для R, щоб підходити до Маркова переходу моделі, а пізніше описують 'msm' як обробку часу безперервно на відміну від пакету R для НММ).

4) Де вміщуються інші концепції, наприклад, динамічні байєсівські мережі?

Згідно з Вікіпедією, динамічна байєсівська мережа - це "узагальнення прихованих моделей Маркова та фільтрів Кальмана". В іншому місці я бачив приховані моделі Маркова, визначені як особливий випадок динамічної байєсівської мережі, "яка весь стан світу представлена єдиною змінною прихованого стану" ( Визначення динамічної байєсівської системи та її відношення до HMM? ) . Я взагалі розумію цей взаємозв'язок, і це добре пояснюється [6].

Однак мені важко зрозуміти, як ці стосунки вписуються в більш широку картину речей. Тобто, враховуючи цей взаємозв'язок між HMM та DBN, як моделі простору стану та моделі прихованих процесів пов'язані між собою? Як взаємопов’язані всі ці різні типи методів, враховуючи, що, схоже, існує багато "узагальнень" прихованих моделей Маркова?

Список літератури:

[1] Том М. Мітчелл, Ребекка Хатчінсон, Індраяна Рустанді. "Приховані моделі процесів". 2006. CMU-CALD-05-116. Університет Карнегі Меллон.

[2] Олівер Гімінес, Жан-Домінік Лебретон, Жан-Мішель Гайлард, Ремі Чоке, Роджер Прадель. "Оцінка демографічних параметрів за допомогою прихованих динамічних моделей процесу". Теоретична біологія населення. 2012. 82 (4): 307–316.

[3] Барбара Енгельгардт. "Приховані моделі Маркова та державні космічні моделі". STA561: Імовірнісне машинне навчання. Університет герцога. http://www.genome.duke.edu/labs/engelhardt/courses/scribe/lec_09_25_2013.pdf

[4] Йероен К. Вермунт. "Багаторівневе латентне моделювання Маркова в безперервному часі з додатком до аналізу даних про амбулаторне оцінювання настрою". Семінар соціальної статистики. 2012. Тільбургський університет. http://www.lse.ac.uk/statistics/events/SpecialEventsandConferences/LSE2013-Vermunt.pdf

[5] Кен Річардсон, Девід Харте, Крісті Картер. «Розуміння переходів щодо охорони здоров’я та робочої сили: застосування моделей Маркова до даних поздовжніх даних SoFIE». Офіційна серія досліджень статистики. 2012 рік.

[6] Зубін Гахрамані. "Вступ до прихованих моделей Маркова та байєсівських мереж". Журнал розпізнавання образів та штучного інтелекту. 2001. 15 (1): 9-42.

machine-learning self-study hidden-markov-model

— Райан Сіммонс
джерело

Ви також можете спробувати повторювану нейронну мережу. У процесі розпізнавання мовлення деякі з них успішно використовують їх як заміну для HMM.

— Альберт

Дякую за пропозицію. На даний момент я вважаю за краще уточнити свої питання щодо цих методів, перш ніж перейти до вивчення нових.

— Райан Сіммонс

Вони посилаються на одне і те ж. Будь ласка, дивіться scilarpedia.org/article/State_space_model Sangdon

@Ryan Simmons Я думаю, що було б гарною ідеєю переглянути відео з MaticalMonk (він же Джефрі Міллер) про ланцюги markov та приховані моделі markov на youtube.

— JimBoy

Оскільки ви, напевно, вже передавали свою дисертацію, чи не хотіли б ви самі відповісти на це запитання? Я б хотів, щоб тут відповіли експерти, що, ймовірно, стосується і майже 800 інших людей, які читають це питання.

— Ульф Аслак

Далі цитується з веб-сайту Scholarpedia :

Модель простору станів (SSM) відноситься до класу імовірнісної графічної моделі (Koller та Friedman, 2009), яка описує ймовірнісну залежність між змінною латентного стану та спостережуваним вимірюванням. Стан або вимірювання можуть бути як безперервними, так і дискретними. Термін "державний простір" зародився в 1960-х роках у галузі керуючої техніки (Калман, 1960). SSM забезпечує загальну основу для аналізу детермінованих та стохастичних динамічних систем, які вимірюються або спостерігаються за допомогою стохастичного процесу. Структура SSM успішно застосовується в техніці, статистиці, інформатиці та економіці для вирішення широкого кола проблем динамічних систем. Інші терміни, що використовуються для опису SSM, - це приховані моделі Маркова (HMM) (Rabiner, 1989) та приховані моделі процесів. Найбільш добре вивчений ССМ - це фільтр Кальмана,

— user93693
джерело

Я і Алан Хоукс писали досить багато про сукупні Маркові процеси з дискретними станами в безперервному часі. Наш матеріал стосувався проблеми інтерпретації спостережень молекул одноіонних каналів і включає точне лікування пропущених коротких подій. Подібна теорія працює і в теорії надійності. Він цілком може бути адаптований до інших проблем. Див. Http://www.onemol.org.uk/?page_id=175 для посилань.

— Девід Колкхун
джерело