Для чого потрібні автокодери?


17

Останнім часом я вивчаю автокодери. Якщо я правильно зрозумів, автокодер - це нейронна мережа, де вхідний шар ідентичний вихідному шару. Отже, нейронна мережа намагається передбачити вихід, використовуючи вхід як золотий стандарт.

У чому корисність цієї моделі? Які переваги намагаються відновити деякі вихідні елементи, зробивши їх максимально рівними вхідним елементам? Чому треба використовувати всю цю техніку, щоб дістатися до тієї ж відправної точки?

Відповіді:


17

Автоматичні кодери мають вхідний шар, прихований шар та вихідний шар. Вхід змушений бути таким же ідентичним виводу, тому його прихований шар нас цікавить.

Прихований шар утворює своєрідне кодування вводу. "Метою автоматичного кодера є вивчення стислого, розподіленого подання (кодування) для набору даних." Якщо вхід - 100 мірний вектор, і у вас є 60 нейронів у прихованому шарі, то алгоритм автоматичного кодування буде повторювати вхід у вигляді 100-мірного вектора у вихідному шарі, в процесі надання вам 60-мірного вектора, який кодує ваш вхід .

Тому метою автоматичних кодерів є зменшення розмірності , серед багатьох інших.


Дякую @Madhulika, можливо, я зрозумів. Алгоритм працює наступним чином: він має вхідний шар, він тренує нейронну мережу, щоб мати вихідний шар, ідентичний вхідному шару. Чим він порівнює вхідний шар із вихідним шаром, і якщо вони різні, він продовжує тренувати нейронну мережу. Він зупиняється, коли вони однакові. Коли він закінчується, ми приймаємо останній прихований шар як найкраще наближення зменшення розмірності вхідного шару і використовуємо його для будь-якої необхідної нам мети. Це правильно?
ларі

Так, це ти майже зрозумів. :) Прочитайте додаткову літературу про це.
Мадхуліка Мукерджі

5

Він також може моделювати свою сукупність, щоб при введенні нового вектора ви могли перевірити, наскільки різний вихід із вхідних даних. Якщо вони "зовсім" однакові, можна припустити, що вхід відповідає населенню. Якщо вони "зовсім" інші, то, ймовірно, вхід не належить населенню, яке ви моделювали.

Я розглядаю це як своєрідну "регресію нейронних мереж", де ви намагаєтеся мати функцію, що описує ваші дані: її вихід такий же, як і вхідний.


3

Можливо, ці малюнки дають вам інтуїцію. Як зазначає вище зазначений авто кодер, намагається витягнути деякі функції високого рівня з навчальних прикладів. Ви можете побачити, як алгоритм прогнозування використовується для тренування кожного прихованого рівня окремо для глибокого NN на другій картині.

введіть тут опис зображення

введіть тут опис зображення

Фотографії взяті з російської вікіпедії.


2
Прокоментувати фотографії було б корисно.
Тім
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.