Запитання з тегом «neural-networks»

Штучні нейронні мережі (АНН) - це широкий клас обчислювальних моделей, що базуються на біологічних нейронних мережах. Вони охоплюють подачі NN (включаючи "глибокі" NN), звивисті NN, повторювані NN тощо.

1
Чи можна використовувати ReLU в автоенкодері як функцію активації?
Під час реалізації автокодера з нейронною мережею більшість людей використовуватиме сигмоїд як функцію активації. Чи можемо ми використовувати замість ReLU? (Оскільки ReLU не має обмежень на верхній межі, в основному означає, що вхідне зображення може мати піксель більше 1, на відміну від обмежених критеріїв для автокодера, коли використовується сигмоїд).

2
Питання про суцільну сумку слів
У мене виникають проблеми з розумінням цього речення: Перша запропонована архітектура схожа на подачу NNLM, де нелінійний прихований шар видаляється і проекційний шар ділиться на всі слова (не тільки проекційну матрицю); таким чином, усі слова проектуються в одне і те ж положення (їхні вектори усереднюються). Що таке шар проекції проти …

1
Навчання нейронної мережі згортки
Зараз я працюю над програмним забезпеченням для розпізнавання облич, яке використовує нейронні мережі згортки для розпізнавання облич. Спираючись на свої читання, я зрозумів, що звивиста нейронна мережа має загальну вагу, щоб заощадити час під час тренувань. Але як адаптувати зворотне розповсюдження, щоб його можна було використовувати в нейромережі згортки. Для …

2
Гранічний графік рішення для перцептрона
Я намагаюся побудувати межу рішення алгоритму перцептрона, і я дуже заплутаний у кількох речах. Мої вхідні екземпляри мають форму , в основному 2D вхідний екземпляр ( і ) і цільове значення двійкового класу ( ) [1 або 0].х 1 х 2 у[ ( х1, х2) , у][(x1,x2),y][(x_{1},x_{2}), y]х1x1x_{1}х2x2x_{2}уyy Звідси мій …

2
Обчислення VC-виміру нейронної мережі
Якщо у мене є якась фіксована непотокована (DAG) топологія (фіксований набір вузлів і ребер, але алгоритм навчання може змінювати вагу по краях) сигмовидних нейронів з вхідними нейронами, які можуть приймати рядки лише в як вхідний і веде до одного виходу (що виводить реальне значення, яке ми округляємо до 1 або …

2
Як покращити стабільність нейронної мережі?
Я використовую Neuralnet в R, щоб побудувати мережу NN з 14 входами і одним виходом. Я будую / треную мережу кілька разів, використовуючи одні й ті ж вхідні дані навчання та ті ж мережеві архітектури / налаштування. Після створення кожної мережі я використовую її на окремому наборі тестових даних для …

4
Чому ми просто не вивчимо гіпер параметри?
Я реалізовував досить популярний документ " ПОЯСНЕННЯ ТА ПІДПРИЄМСТВО ДОСЛІДНИХ ПРИКЛАДІВ ", і в роботі він тренує протиборчу цільову функцію J '' (θ) = αJ (θ) + (1 - α) J '(θ). Це трактує α як гіперпараметр. α може бути 0,1, 0,2, 0,3 і т.д. Незалежно від цього конкретного документу, …

2
Чи не було б кілька фільтрів у згортковому шарі вивчити один і той же параметр під час тренування?
Виходячи з того, що я дізнався, ми використовуємо кілька фільтрів у конвеєрному шарі CNN для вивчення різних детекторів функцій. Але оскільки ці фільтри застосовуються аналогічно (тобто ковзають і примножуються до областей введення), чи не просто вони засвоїли б однакові параметри під час тренування? Отже, використання декількох фільтрів буде зайвим?

3
CIFAR-10 Не може перевищити 60% точності, Керас із Tensorflow backkend [закрито]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закритий минулого року . Навчання після 15 епох на наборі даних CIFAR-10, схоже, втрати валідації більше не зменшуються, припадаючи на 1,4 (з 60% точністю перевірки). Я перемістив …

2
Чи може згорткова нейронна мережа приймати як вхідні зображення різних розмірів?
Я працюю в мережі згортки для розпізнавання зображень, і мені було цікаво, чи можу я вводити зображення різного розміру (хоча не дуже різного). Про цей проект: https://github.com/harvardnlp/im2markup Вони кажуть: and group images of similar sizes to facilitate batching Тож навіть після попередньої обробки зображення все ще мають різні розміри, що …

4
різниця між нейронною мережею та глибоким навчанням
З точки зору різниці між нейронною мережею та глибоким навчанням, ми можемо перелічити декілька предметів, таких як включено більше шарів, масивний набір даних, потужне комп'ютерне обладнання, щоб зробити навчання складною моделлю можливою. Окрім них, чи є більш детальне пояснення щодо різниці між NN та DL?

2
Чи графічні моделі та машини Больцмана пов'язані математично?
Хоча я фактично займався програмуванням з машинами Больцмана на уроці фізики, я не знайомий з їх теоретичною характеристикою. Навпаки, я знаю скромну кількість про теорію графічних моделей (про перші кілька розділів книги « Графічні моделі» Лаурітцена ). Запитання: Чи є якісь змістовні зв’язки між графічними моделями та машиною Больцмана? Чи …

1
Співвідношення між швидкістю навчання та кількістю прихованих шарів?
Чи є якесь правило між глибиною нейронної мережі та швидкістю навчання? Я помічав, що чим глибше мережа, тим нижчим повинен бути рівень навчання. Якщо це правильно, чому це так?

3
Чи можна навчити нейронну мережу малювати зображення в певному стилі?
Чи можна навчити нейронну мережу малювати зображення в певному стилі? (Отже, він знімає зображення і перемальовує його у стилі, для якого він був навчений.) Чи є якась затверджена технологія для такого роду речі? Я знаю про алгоритм DeepArt. Добре заповнити основне зображення певним малюнком (наприклад, vangoghify image), але я шукаю …

1
Чи нейронні мережі зазвичай потребують певного часу, щоб "піднятися" під час тренувань?
Я намагаюся навчити глибоку нейронну мережу для класифікації, використовуючи зворотне поширення. Зокрема, я використовую звивисту нейронну мережу для класифікації зображень, використовуючи бібліотеку потоків тензорів. Під час тренувань я відчуваю якусь дивну поведінку, і мені просто цікаво, чи це типово, чи я можу робити щось не так. Отже, моя конволюційна нейронна …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.