Я абсолютно новачок у нейронних мережах, але дуже зацікавлений у їх розумінні. Однак починати зовсім непросто.
Хто-небудь може порекомендувати гарну книгу чи будь-який інший ресурс? Чи потрібно читати?
Я вдячний за будь-яку пораду.
Я абсолютно новачок у нейронних мережах, але дуже зацікавлений у їх розумінні. Однак починати зовсім непросто.
Хто-небудь може порекомендувати гарну книгу чи будь-який інший ресурс? Чи потрібно читати?
Я вдячний за будь-яку пораду.
Відповіді:
Нейронні мережі існували деякий час, і вони різко змінилися за ці роки. Якщо ви лише обмірковуєте мережу в Інтернеті, у вас може скластися враження, що "нейронна мережа" означає багатошарову мережу подачі даних, яка навчається з зворотним поширенням. Або ви можете натрапити на будь-яку з десятків рідко використовуваних, химерно названих моделей і зробити висновок, що нейронні мережі - це скоріше зоопарк, ніж дослідницький проект. Або що вони новинка. Або ...
Я міг би продовжувати. Якщо ви хочете чіткого пояснення, я б послухав Джеффрі Хінтона . Він був назавжди і, отже, робить велику роботу, переплітаючи всі різні моделі, над якими працював, в одну згуртовану, інтуїтивну (а іноді і теоретичну) історичну розповідь. На його домашній сторінці є посилання на лекції Google Tech Talks та Videolectures.net (про RBMs та Deep Learning , серед інших).
З того, як я це бачу, ось історико-педагогічна дорожня карта до розуміння нейронних мереж, від їх виникнення до найсучаснішого:
Я настійно рекомендую переглянути ці лекції та використовувати це як матеріал для читання . Ці лекції про машинне навчання в цілому Ендрю Нг довго розмовляє про нейронні мережі і намагається зробити це доступним для початківців.
Це, на мій погляд, дуже хороші книги.
Книги мають певну схожість: обидві вони мають близько 500 сторінок, і вони досить старі, починаючи з 1995 року. Проте вони залишаються дуже корисними. Обидві книги починаються з нуля, пояснюючи, що таке нейронні мережі. Вони дають чіткі пояснення, хороші приклади та хороші графіки, щоб допомогти зрозуміти. Вони дуже докладно пояснюють питання тренувань нейронних мереж у їх багатьох формах та формах, а також те, що вони можуть, а що не можуть робити. Дві книги дуже приємно доповнюють одна одну, оскільки те, що з однією книгою неможливо розібратися, одне прагне знайти в іншій.
Rojas має розділ, який мені особливо подобається, про реалізацію зворотного розповсюдження на багатьох шарах у матричній формі. У ньому є приємний розділ про нечітку логіку та один про теорію складності. Але тоді у Бішопа є безліч інших приємних розділів.
Rojas - це, я б сказав, найдоступніший. Бішоп є більш математичним і, можливо, більш досконалим. В обох книгах математика - це здебільшого лінійна алгебра та обчислення функцій декількох змінних (часткові похідні тощо). Без будь-яких знань з цих предметів ви, мабуть, не знайшли б жодної з цих книг дуже яскравою.
Я б рекомендував спочатку прочитати Рохаса.
В обох книгах, очевидно, є багато сказати про алгоритми, але ні багато не говорить про конкретні реалізації в коді.
Як мені здається, ці книги забезпечують передумови, що дозволяють зрозуміти он-лайн курс (наприклад, Гінтон, Курсера). Книги також висвітлюють набагато більше, і набагато більше деталей, ніж це можна зробити в Інтернеті.
Я сподіваюся, що це допомагає, і я раді відповісти на будь-які запитання про книги.
Як зазначали інші, в Інтернеті є багато (хороших) ресурсів, і я особисто зробив деякі з них:
Хочу звернути увагу на той факт, що ці експозиції здебільшого дотримувалися класичної обробки, коли шари (підсумовування та нелінійність разом) є основними одиницями. Більш популярна і гнучка обробка, реалізована в більшості бібліотек, таких як torch-nn і tensorflow, тепер використовує обчислювальний графік з автоматичною диференціацією для досягнення високої модульності. Концептуально це простіше і звільняє. Я дуже рекомендую відмінний відкритий курс Stanford CS231n для цього лікування.
Для суворого, теоретико-теоретичного лікування, ви можете проконсультуватися з " Нейронних мереж " Ентоні та Бартлетта.
Якщо ви хочете отримати лікування з більш статистичної точки зору, перегляньте "Розпізнавання візерунків та нейронні мережі" Брайана Ріплі. Ця книга не є вступною і передбачає деякий статистичний досвід.
Я створив веб-додаток, який підтримує ваш процес навчання в галузі нейронних мереж.
Ви можете пограти з налаштуваннями (архітектура, функції активації, налаштування тренувань) і спостерігати, як налаштування впливають на прогнози. Усі набори даних мають заздалегідь налаштовані значення, які можна прийняти. Також можливо створити власні набори даних.
Інструкції та пояснення до реалізованих елементів: