Спершу слід дізнатися про простіші для кодування моделі простору стану та фільтрацію закритої форми (тобто фільтри Калмана, приховані моделі марків). Меттью Ганн правдивий, що ти можеш дістатися напрочуд далеко за допомогою простих концепцій, але, на мою скромну думку, ти повинен зробити це проміжною метою, оскільки:
1.) Порівняно кажучи, у моделях простору держав є більше рухомих частин. Коли ви вивчаєте SSM або приховані моделі markov, є багато позначень. Це означає, що в робочій пам’яті є ще багато речей, які потрібно зберігати, коли ви граєте, перевіряючи речі. Особисто я, коли спершу я дізнався про фільтри Кальмана та лінійно-гауссові ССМ, я в основному думав: «е-е, це все лише властивості багатоваріантних нормальних векторів ... я просто повинен відслідковувати, яка матриця є». Крім того, якщо ви перемикаєтесь між книгами, вони часто змінюють позначення.
Згодом я подумав про це як "е-е, це все лише правило Байєса в кожний момент часу". Коли ви думаєте про це таким чином, ви розумієте, чому родинні сім’ї є приємними, як у випадку з фільтром Калмана. Коли ви кодуєте приховану модель маркова та її дискретний простір станів, ви бачите, чому вам не доведеться обчислювати будь-яку ймовірність, і фільтрувати / розгладжувати це легко. (Я думаю, що я відхиляюся від загальноприйнятого хм-аргону тут.)
2.) Вирізання зубів при кодуванні багатьох із них допоможе вам зрозуміти, наскільки загальним є визначення простору моделі стану. Досить скоро ви будете записувати моделі, які ви хочете використовувати, і в той же час бачите, чому ви не можете. Спочатку ви зрештою побачите, що просто не можете записати його в одну з цих двох форм, до яких ви звикли. Коли ви ще трохи подумаєте про це, ви записуєте правило Байєса і бачите, що проблема полягає у вашій нездатності обчислити якусь ймовірність даних.
Таким чином, ви зрештою не зможете обчислити ці задні розподіли (згладжування або фільтрування розподілів станів). Щоб подбати про це, там є багато приблизних речей для фільтрування. Фільтрація частинок - лише одна з них. Основний винос фільтрації частинок: ви моделюєте ці розподіли, оскільки не можете їх обчислити.
Як ви моделюєте? Більшість алгоритмів є лише деяким варіантом вибірки важливості. Але і тут стає складніше. Я рекомендую цей підручник з Доусета та Йохансена ( http://www.cs.ubc.ca/~arnaud/doucet_johansen_tutorialPF.pdf ). Якщо ви розумієте, як працює фільтрація закритої форми, вони вводять загальну ідею вибірки важливості, потім загальну ідею методу Монте Карло, а потім показують, як використовувати ці дві речі, щоб почати з приємного прикладу фінансових часових рядів. ІМХО, це найкращий підручник з фільтрації частинок, який я натрапив.
Окрім додавання до поєднання двох нових ідей (вибірки важливості та методу Монте-Карло), тепер є більше позначень. Деякі щільності, які ви відбираєте відтепер; деякі ви оцінюєте, а коли оцінюєте їх, ви оцінюєте на вибірках. Результат після того, як ви все це зашифрували, зважуються зразками, що вважаються частинками. Вони змінюються після кожного нового спостереження. Було б дуже важко підібрати все це одразу. Я думаю, що це процес.
Прошу вибачення, якщо я натрапляю на них як дурний або рукописний. Це лише часовий графік мого особистого знайомства з темою. Повідомлення Меттью Ганна, ймовірно, прямо відповідає на ваше запитання. Я просто подумав, що викину цю відповідь.