Я розумію, що попередня підготовка використовується для уникнення деяких проблем із звичайною підготовкою. Якщо я використовую backpropagation з, скажімо, автокодером, я знаю, що я зіткнуся з проблемами у часі, оскільки зворотне розповсюдження відбувається повільно, а також, що я можу зациклюватися на локальній оптимі і не вивчити певні функції.
Я не розумію, як ми шукаємо мережу і що конкретно ми робимо для пошуку. Наприклад, якщо нам надають стек обмежених машин Boltzmann, як би ми провели цю мережу?