Огляд обмежених машин Больцмана
Обмежена машина Больцмана (RBM) - це генеративна модель, яка вивчає розподіл ймовірностей над входом. Це означає, що після тренувань, УЗМ може генерувати нові зразки із засвоєного розподілу ймовірностей. Розподіл ймовірностей по видимим одиницям задається
де
і - сигмоїдна функція, - це зміщення для видимого вузла , а - вага від до p ( v ∣ h ) = V ∏ i = 0 p ( v i ∣ h ) , p ( v i ∣ h ) = σ ( a i + H ∑ j = 0 w j i h j ) σ a i i w j i h j v i p ( v ∣ hv
p(v∣h)=∏i=0Vp(vi∣h),
p(vi∣h)=σ(ai+∑j=0Hwjihj)
σaiiwjihjvi. З цих двох рівнянь випливає, що залежить лише від прихованих станів . Це означає, що інформація про те, як генерується видимий зразок , повинна зберігатися у прихованих одиницях, вагах та ухилах.
h vp(v∣h)hv
Використання УЗМ для класифікації
Використовуючи RBM для завдань класифікації, ви використовуєте таку ідею: оскільки інформація про те, як створені ваші тренувальні або тестові дані зберігається у прихованих одиницях , ви можете витягти ці основні фактори, подавши навчальний зразок у видимі одиниці УЗМ, розповсюджуйте його вперед до прихованих одиниць і використовуйте цей вектор прихованих одиниць як вектор функції. Ви більше не робите назад, щоб переходити до видимих одиниць.h
Цей прихований вектор є лише перетвореною версією вхідних даних - це не може нічого класифікувати самостійно. Щоб зробити класифікацію, ви підготували будь-який класифікатор (лінійний класифікатор, SVM, нейронну мережу, що рухається, або що-небудь інше) із прихованим вектором замість "сировинних" навчальних даних як вхідних даних.
Якщо ви будуєте мережу з глибокими переконаннями (DBN) - яка використовувалася для попереднього тренування глибоких нейронних мереж подачі вперед без нагляду - ви б взяли цей прихований вектор і використали його як вхід до нової УВМ, яку ви стекаєте зверху. Таким чином, ви можете тренувати мережу пошарово, до досягнення потрібного розміру, не потребуючи мічених даних. Нарешті, ви додасте, наприклад, шар softmax у верхній частині, і навчіть всю мережу із зворотним розповсюдженням для вашого завдання класифікації.