Машини Больцмана з обмеженою регресією?


13

Я продовжую відповідати на запитання, яке я задавав раніше щодо УЗМ . Я бачу багато літератури, що описує їх, але жодна, яка насправді говорить про регресію (навіть не класифікація з міченими даними). У мене виникає відчуття, що він використовується лише для не маркованих даних. Чи є ресурси для лікування регресії? Або це так просто, як додати ще один шар поверх прихованого шару і запустити алгоритм CD вгору і вниз? Дякую заздалегідь.

Відповіді:


18

Ви маєте рацію щодо незазначених даних. МПУ - це генеративні моделі, які найчастіше використовуються як неуправляючі учні.

При побудові мережі глибоких переконань найбільш типовою процедурою є просто навчання кожного нового КВМ по одному, коли вони складаються один на одного. Тож контрастна розбіжність не йде вгору і вниз в тому сенсі, як я думаю, ви маєте на увазі. Він працює лише з однією УЗМ за один раз, використовуючи прихований шар попереднього найвищого УЗМ в якості вхідного сигналу для нового самого верхнього УЗМ. Після всього цього ви можете або ставитись до стеку ваг RBM як до початкових ваг для стандартної нейронної мережі передачі вперед і тренуватися, використовуючи мічені вами дані та зворотне розповсюдження, або робити щось більш екзотичне, як використовувати алгоритм неспання. Зауважте, що ми не використовували жодних мічених даних до останнього кроку, що є однією з переваг цих типів моделей.

З іншого боку, існує декілька способів використання КВМ для класифікації.

  • Навчіть МПУ або стек з декількох МПУ. Використовуйте верхній прихований шар як вхід для якогось іншого підконтрольного учня.
  • Навчіть КУП для кожного класу та використовуйте ненормалізовані енергії як вхід до дискримінаційного класифікатора.
  • Навчіть ШПМ як модель спільної щільності P (X, Y). Тоді, задавши деякий вхід x, просто виберіть клас y, який мінімізує енергетичну функцію (нормалізація тут не проблема, як у наведеному вище, оскільки константа Z однакова для всіх класів).
  • Тренуйте дискримінаційну УПМ

Я б настійно пропонував вам ознайомитись з технічним звітом Практичний посібник з навчання обмежених машин Больцмана Джеффа Гінтона. Він обговорює декілька цих питань набагато детальніше, надає безцінні поради, цитує безліч релевантних робіт і може допомогти усунути будь-яку іншу плутанину, яка може виникнути.


1
тож можна використовувати КВМ для регресії?
waspinator

Як ви тренуєте КУП як модель спільної щільності? Надаючи і X, і Y як не приховані входи, тобто ви тренуєтесь, щоб вони були P (X, Y | H) (H - прихований шар)?
AkiRoss

Я самовідповідаюсь на свій коментар: так, у "Практичному посібнику з навчання ОРМ" (Hinton, 2010) 3 описаних вище способу детально пояснюються, а в третьому методі він говорить про наявність "двох наборів видимих одиниць ", де, крім даних, представлений блок мітки softmax для представлення класу.
AkiRoss

2

Погляньте на реалізацію, http://code.google.com/p/matrbm/ . Він має функцію класифікації rmb fit, яку варто врахувати. Також повідомте мені, якщо ви знайдете кращі реалізації DBN та RMB для класифікації та регресії.


0

Я думаю, що один із способів тестування нейронних мереж, таких як Машина Больцмана з обмеженими можливостями, - це застосувати їх до нових наборів даних або, частіше, підмножини загального набору даних, і подивитися, як вони працюють. Ви також можете протестувати модель з перехресною валідацією. Я використовував популярний інструментарій програмного забезпечення машинного навчання з відкритим кодом (ML), який простий в установці та використанні, і він дозволяє легко тестувати багато типів алгоритмів ML окремо за допомогою ряду статистичної регресії моделі ( http: // www. cs.waikato.ac.nz/ml/weka/ ). Це може дати вам швидкий аналіз без особливого втручання, за винятком основ роботи програми, хоча залежно від цього, можливо, не варто, якщо буде важко відформатувати ваші дані (хоча, як правило, ви можете google "csv to arff convert online", наприклад для одномоментного форматування).

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.