Запитання з тегом «neural-network»

Штучні нейронні мережі (ANN) складаються з «нейронів» - програмуючих конструкцій, що імітують властивості біологічних нейронів. Набір зважених зв’язків між нейронами дозволяє поширювати інформацію через мережу для вирішення проблем штучного інтелекту, без того, щоб дизайнер мережі мав модель реальної системи.

3
Як додати нову категорію до моделі глибокого навчання?
Скажіть, я переклав навчання за попередньо підготовленою мережею, щоб розпізнати 10 об’єктів. Як додати 11-й елемент, який мережа може класифікувати, не втрачаючи всіх 10 категорій, які я вже навчив, а також інформацію з оригінальної попередньо підготовленої моделі? Друг сказав мені, що в цій галузі проводяться активні дослідження, але я не …

1
Різниця функцій активації в нейронних мережах загалом
Я вивчив типи функцій активації для нейронних мереж. Самі функції досить прості, але різниця в застосуванні не зовсім зрозуміла. Розумно, що можна розрізняти логічні та лінійні функції типу, залежно від бажаного бінарного / безперервного виводу, але яка перевага сигмоїдної функції перед простою лінійною? Наприклад, для мене дуже важко зрозуміти ReLU: …

3
Яка різниця між RNN на основі слів на основі слів і на основі знаків?
Читаючи про генерування тексту за допомогою періодичних нейронних мереж, я помітив, що деякі приклади були реалізовані для генерації тексту слово за словом, а інші - за символом, не фактично вказуючи чому. Отже, в чому різниця між моделями РНН, котрі пророкують текст кожного слова основи і ті , які пророкують текст …

2
Чому функції активації повинні бути монотонними?
Зараз я готуюсь до іспиту з нейронних мереж. У кількох протоколах попередніх іспитів я читав, що функції активації нейронів (у багатошарових персептронах) повинні бути монотонними. Я розумію, що функції активації повинні бути диференційованими, мати похідну, яка не є 0 у більшості точок, і бути нелінійною. Я не розумію, чому бути …

1
Як додати функції зображень, що не належать до зображень, поруч із зображеннями бік як вхід CNN
Я треную конволюційну нейронну мережу для класифікації зображень за умовами туману (3 класи). Однак для кожного з приблизно 150 000 зображень у мене також є чотири метеорологічні змінні, які можуть допомогти передбачити класи зображень. Мені було цікаво, як я можу додати метеорологічні змінні (наприклад, температуру, швидкість вітру) до існуючої структури …

1
Поширення назад через максимум шарів об'єднання
У мене є невелике підпитання до цього питання . Я розумію, що при розповсюдженні назад через максимальний шар об'єднання градієнт повертається назад таким чином, що нейрон в попередньому шарі, який був обраний як max, отримує весь градієнт. У чому я не впевнений на 100% - це те, як градієнт у …


3
Навіщо перекручувати, якщо Макс Пуллінг все-таки збирається зменшити вибірку зображення?
Ідея застосування фільтрів, щоб зробити щось на кшталт виявлення країв, є досить крутою ідеєю. Наприклад, ви можете зробити зображення 7. За допомогою деяких фільтрів ви можете перетворити зображення, які підкреслюють різні характеристики вихідного зображення. Оригінал 7: може сприйматися мережею як: Зверніть увагу, як кожне зображення витягувало інший край оригіналу 7. …

4
Як масштабувати масив підписаних цілих чисел для діапазону від 0 до 1?
Я використовую Brain для тренування нейронної мережі на наборі функцій, що включає як позитивні, так і негативні значення. Але для мозку потрібні вхідні значення від 0 до 1. Який найкращий спосіб нормалізувати мої дані?

3
Що означає вихід моделі model.predict від Keras?
Я створив модель LSTM для передбачення повторюваних питань на офіційному наборі даних Quora. Тестові мітки дорівнюють 0 або 1. 1 означає, що пара запитань є дублікатом. Після побудови моделі за допомогою model.fitя тестую модель, використовуючи model.predictдані тесту. Вихід - це масив значень, таких як нижче: [ 0.00514298] [ 0.15161049] [ …

2
Чому генетичні алгоритми не використовуються для оптимізації нейронних мереж?
З мого розуміння, генетичні алгоритми є потужним інструментом оптимізації багато об'єктів. Крім того, навчання нейронних мереж (особливо глибоких) є важким та має багато питань (невипуклі функції витрат - локальні мінімуми, зниклі та вибухові градієнти тощо). Крім того, я вважаю, що концептуальна підготовка NN з GA є можливою. Мені було цікаво, …


2
Чому б не завжди використовувати техніку оптимізації ADAM?
Здається, оптимізатор адаптивного оцінювання моменту (Адама) майже завжди працює краще (швидше і надійніше досягаючи глобального мінімуму), коли мінімізує функцію витрат на навчання нейронних мереж. Чому б не завжди використовувати Адама? Навіщо навіть турбуватися використанням RMSProp або оптимізаторів імпульсу?

2
Візуалізація тренувань з глибокої нейромережі
Я намагаюся знайти еквівалент діаграм Хінтона для багатошарових мереж, щоб скласти графік ваг під час тренувань. Навчена мережа дещо схожа на Deep SRN, тобто вона має велику кількість матриць з декількома вагами, що зробить одночасний графік декількох діаграм Хінтона візуально заплутаним. Хтось знає про хороший спосіб візуалізації процесу оновлення ваги …

3
Чому автоенкодери для зменшення розмірів симетричні?
Я не є експертом з автокодерів чи нейронних мереж будь-якими способами, тому вибачте мене, якщо це дурне питання. З метою зменшення розмірів або візуалізації кластерів у даних високих розмірів, ми можемо використовувати автокодер для створення (втраченого) 2-мірного подання, перевіряючи вихід мережевого шару з 2-ма вузлами. Наприклад, за допомогою наступної архітектури …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.