Я намагаюся зрозуміти, як працюють машини Boltzmann, але я не зовсім впевнений, як вивчають ваги, і не зміг знайти чіткого опису. Чи правильно таке? (Також вказівки на будь-які хороші пояснення Болцмана також будуть чудовими.)
У нас є набір видимих одиниць (наприклад, відповідних чорним / білим пікселям на зображенню) та набір прихованих одиниць. Ваги якось ініціалізуються (наприклад, рівномірно від [-0.5, 0.5]), а потім ми чергуємо дві наступні фази, поки не буде досягнуто якогось правила зупинки:
Затиснута фаза - У цій фазі всі значення видимих одиниць фіксуються, тому ми лише оновлюємо стани прихованих одиниць (відповідно до правила стохастичної активації Больцмана). Ми оновлюємось, поки мережа не досягне рівноваги. Як тільки ми досягнемо рівноваги, ми продовжуємо оновлення ще разів (для деяких заздалегідь визначених N ), відслідковуючи середнє значення x i x j (де x i , x j - стани вузлів i та j ). Після цих N оновлень рівноваги ми оновлюємо w i j = w i j +
Тому мої основні питання:
Щоразу, коли ми перебуваємо у затиснутій фазі, чи повертаємо видимі одиниці до однієї з моделей, яку ми хочемо вивчити (з певною частотою, яка представляє важливість цієї картини), чи залишаємо видимі одиниці у стані, в якому вони були в кінці вільної фази?
Чи робимо ми пакетне оновлення ваг в кінці кожної фази чи оновлюємо ваги на кожному етапі рівноваги у фазі? (Або один штраф?)