Запитання з тегом «neural-networks»

Штучні нейронні мережі (АНН) - це широкий клас обчислювальних моделей, що базуються на біологічних нейронних мережах. Вони охоплюють подачі NN (включаючи "глибокі" NN), звивисті NN, повторювані NN тощо.

4
Чим відрізняється Conv1D від Conv2D?
Я переглядав документи про згортку keras і знайшов два типи конвультури Conv1D і Conv2D. Я здійснив деякий пошук в Інтернеті, і це те, що я розумію про Conv1D та Conv2D; Conv1D використовується для послідовностей, а Conv2D - для зображень. Я завжди думав, що звивисті нервові мережі використовуються лише для зображень …

3
Знакові (іграшкові) моделі нейронних мереж
Мої професори фізики в середній школі, а також благородний лауреат Фейнман завжди представляли те, що вони називали іграшковими моделями, щоб проілюструвати основні поняття та методи фізики, такі як гармонійний генератор, маятник, прядильна поверхня та чорний ящик. Які моделі іграшок використовуються для ілюстрації основних понять та методів, що лежать в основі …

3
що робить нейронні мережі нелінійною моделлю класифікації?
Я намагаюся зрозуміти математичний зміст нелінійних моделей класифікації: Я щойно прочитав статтю, яка розповідає про нейронні мережі як нелінійну модель класифікації. Але я просто розумію, що: Перший шар: h1=x1∗wx1h1+x2∗wx1h2h1=x1∗wx1h1+x2∗wx1h2h_1=x_1∗w_{x1h1}+x_2∗w_{x1h2} h2=x1∗wx2h1+x2∗wx2h2h2=x1∗wx2h1+x2∗wx2h2h_2=x_1∗w_{x2h1}+x_2∗w_{x2h2} Наступний шар y=b∗wby+h1∗wh1y+h2∗wh2yy=b∗wby+h1∗wh1y+h2∗wh2уy=b∗w_{by}+h_1∗w_{h1y}+h_2∗w_{h2y} Можна спростити до =b'+(x1∗wx1h1+x2∗wx1h2)∗wh1y+(x1∗wx2h1+x2∗wx2h2)∗wh2y=b′+(x1∗wx1h1+x2∗wx1h2)∗wh1y+(x1∗wx2h1+x2∗wx2h2)∗wh2y=b′+(x_1∗w_{x1h1}+x_2∗w_{x1h2})∗w_{h1y}+(x_1∗w_{x2h1}+x_2∗w_{x2h2})∗w_{h2y} =b'+x1(wh1y∗wx1h1+wx2h1∗wh2y)+x2(wh1y∗wx1h1+wx2h2∗wh2y)=b′+x1(wh1y∗wx1h1+wx2h1∗wh2y)+x2(wh1y∗wx1h1+wx2h2∗wh2y)=b′+x_1(w_{h1y}∗w_{x1h1}+w_{x2h1}∗w_{h2y})+x_2(w_{h1y}∗w_{x1h1}+w_{x2h2}∗w_{h2y}) Двошарова нейромережа - це просто проста лінійна регресія =b′+x1∗W′1+x2∗W′2=b′+x1∗W1′+x2∗W2'=b^′+x_1∗W_1^′+x_2∗W_2^′ Це можна показати …

2
Чи використовуються методи пошуку ліній в глибокому навчанні? Чому ні?
Багато навчальних посібників в Інтернеті говорять про спуск градієнта, і майже всі вони використовують фіксований розмір кроку (швидкість навчання ). Чому не застосовується пошук рядків (наприклад, пошук зворотного відстеження чи точний пошук рядків)?αα\alpha

3
Як розмір партії впливає на конвергенцію SGD і чому?
Я бачив подібний висновок з багатьох дискусій, що в міру збільшення розміру міні-партії збіжність SGD насправді стає важчим / гіршим, наприклад, цей документ і ця відповідь . Також я чув, що люди на ранніх етапах використовують такі хитрощі, як невеликі темпи навчання або розмір партії, щоб вирішити цю складність при …

2
Чи слід брати зразки тренувань випадковим чином для міні-пакетних навчальних нейронних мереж без заміни?
Ми визначаємо епоху як пройшла всю сукупність усіх доступних навчальних зразків, а розмір міні-партії - кількість зразків, за яку ми в середньому знаходимо оновлення ваг / зміщення, необхідних для спуску градієнта. Моє запитання - чи слід ми не замінювати з набору навчальних прикладів, щоб генерувати кожну міні-серію в епоху. Я …

4
Про CNN, ядра та інваріантність масштабу / обертання
У мене є пара питань, які мене бентежать стосовно CNN. 1) Особливості, отримані за допомогою CNN, - інваріантність масштабу та обертання? 2) Ядра, які ми використовуємо для згортання з нашими даними, вже визначені в літературі? що це за ядра? це різне для кожної програми?

1
Тест: Повідомте класифікатора за його межею рішення
Нижче наведено 6 меж рішення. Межі рішення - фіолетові лінії. Точки та хрестики - це два різних набори даних. Ми повинні вирішити, який з них: Лінійний SVM Кернелізоване SVM (Поліномне ядро ​​порядку 2) Перцепрон Логістична регресія Нейронна мережа (1 прихований шар з 10 випрямленими лінійними одиницями) Нейронна мережа (1 прихований …


2
Що таке інтуїтивне пояснення мереж Echo State?
Я новачок у періодичних нейронних мережах (RNN) і все ще вивчаю ці концепції. На абстрактному рівні я розумію, що мережа Echo State (ESN) здатна (повторно) виробляти послідовність входів, тобто сигнал, навіть після видалення входу. Однак, мені здалося, що стаття про Академію занадто складна, щоб зрозуміти та зрозуміти її повністю. Може …

1
Чи відповідає значення R-квадрата для порівняння моделей?
Я намагаюся визначити найкращу модель для прогнозування цін на автомобілі, використовуючи ціни та можливості, доступні на сайтах рекламних оголошень для автомобілів. Для цього я використав пару моделей з бібліотеки scikit-learn та моделей нейронної мережі з пібраїну та нейролаб. Я використовував поки що підхід - це запустити фіксовану кількість даних через …

4
Що означає "ступінь свободи" в нейронних мережах?
У книзі Бішопа «Класифікація візерунків та машинне навчання» він описує техніку регуляризації в контексті нейронних мереж. Однак я не розумію абзац, що описує, що під час тренувального процесу кількість ступенів свободи збільшується разом зі складністю моделі. Відповідна цитата: Альтернативою регуляризації як способу контролю ефективної складності мережі є процедура раннього припинення. …

3
Використання нейронної мережі для торгівлі на біржі
Я пірнув у поле нейронних мереж і захопився ними. Нарешті я розробив прикладну систему для тестування торговельних систем на біржах, і тепер я збираюся реалізувати свою першу нейронну мережу в ній. Дуже простий і примітивний, не призначений для реальної торгівлі, а лише для початківців. Я хочу лише знати, чи хороший …

3
Різниця між зразками, часовими кроками та особливостями нейронної мережі
Я переглядаю такий блог у нейронній мережі LSTM: http://machinelearningmastery.com/understanding-stateful-lstm-recurrent-neural-networks-python-keras/ Автор переробляє вхідний вектор X як [зразки, часові кроки, особливості] для різної конфігурації LSTM. Автор пише Дійсно, послідовності літер є часовими кроками однієї ознаки, а не одним часовим кроком окремих ознак. Ми надали більше контексту для мережі, але не більше послідовності, …

3
Для чого потрібні автокодери?
Останнім часом я вивчаю автокодери. Якщо я правильно зрозумів, автокодер - це нейронна мережа, де вхідний шар ідентичний вихідному шару. Отже, нейронна мережа намагається передбачити вихід, використовуючи вхід як золотий стандарт. У чому корисність цієї моделі? Які переваги намагаються відновити деякі вихідні елементи, зробивши їх максимально рівними вхідним елементам? Чому …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.