Статистика та великі дані neural-networks

1

Чи можна використовувати ReLU в автоенкодері як функцію активації?

Під час реалізації автокодера з нейронною мережею більшість людей використовуватиме сигмоїд як функцію активації. Чи можемо ми використовувати замість ReLU? (Оскільки ReLU не має обмежень на верхній межі, в основному означає, що вхідне зображення може мати піксель більше 1, на відміну від обмежених критеріїв для автокодера, коли використовується сигмоїд).

11 machine-learning neural-networks deep-learning autoencoders

2

Питання про суцільну сумку слів

У мене виникають проблеми з розумінням цього речення: Перша запропонована архітектура схожа на подачу NNLM, де нелінійний прихований шар видаляється і проекційний шар ділиться на всі слова (не тільки проекційну матрицю); таким чином, усі слова проектуються в одне і те ж положення (їхні вектори усереднюються). Що таке шар проекції проти …

11 machine-learning neural-networks natural-language word-embeddings language-models

1

Навчання нейронної мережі згортки

Зараз я працюю над програмним забезпеченням для розпізнавання облич, яке використовує нейронні мережі згортки для розпізнавання облич. Спираючись на свої читання, я зрозумів, що звивиста нейронна мережа має загальну вагу, щоб заощадити час під час тренувань. Але як адаптувати зворотне розповсюдження, щоб його можна було використовувати в нейромережі згортки. Для …

11 machine-learning neural-networks computer-vision backpropagation conv-neural-network

2

Гранічний графік рішення для перцептрона

Я намагаюся побудувати межу рішення алгоритму перцептрона, і я дуже заплутаний у кількох речах. Мої вхідні екземпляри мають форму , в основному 2D вхідний екземпляр ( і ) і цільове значення двійкового класу ( ) [1 або 0].х 1 х 2 у[ ( х1, х2) , у][(x1,x2),y][(x_{1},x_{2}), y]х1x1x_{1}х2x2x_{2}уyy Звідси мій …

11 machine-learning neural-networks python decision-theory perceptron

2

Обчислення VC-виміру нейронної мережі

Якщо у мене є якась фіксована непотокована (DAG) топологія (фіксований набір вузлів і ребер, але алгоритм навчання може змінювати вагу по краях) сигмовидних нейронів з вхідними нейронами, які можуть приймати рядки лише в як вхідний і веде до одного виходу (що виводить реальне значення, яке ми округляємо до 1 або …

11 machine-learning neural-networks algorithms vc-dimension

2

Як покращити стабільність нейронної мережі?

Я використовую Neuralnet в R, щоб побудувати мережу NN з 14 входами і одним виходом. Я будую / треную мережу кілька разів, використовуючи одні й ті ж вхідні дані навчання та ті ж мережеві архітектури / налаштування. Після створення кожної мережі я використовую її на окремому наборі тестових даних для …

11 r machine-learning neural-networks

4

Чому ми просто не вивчимо гіпер параметри?

Я реалізовував досить популярний документ " ПОЯСНЕННЯ ТА ПІДПРИЄМСТВО ДОСЛІДНИХ ПРИКЛАДІВ ", і в роботі він тренує протиборчу цільову функцію J '' (θ) = αJ (θ) + (1 - α) J '(θ). Це трактує α як гіперпараметр. α може бути 0,1, 0,2, 0,3 і т.д. Незалежно від цього конкретного документу, …

11 machine-learning neural-networks deep-learning hyperparameter

2

Чи не було б кілька фільтрів у згортковому шарі вивчити один і той же параметр під час тренування?

Виходячи з того, що я дізнався, ми використовуємо кілька фільтрів у конвеєрному шарі CNN для вивчення різних детекторів функцій. Але оскільки ці фільтри застосовуються аналогічно (тобто ковзають і примножуються до областей введення), чи не просто вони засвоїли б однакові параметри під час тренування? Отже, використання декількох фільтрів буде зайвим?

11 neural-networks conv-neural-network convolution filter

3

CIFAR-10 Не може перевищити 60% точності, Керас із Tensorflow backkend [закрито]

Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закритий минулого року . Навчання після 15 епох на наборі даних CIFAR-10, схоже, втрати валідації більше не зменшуються, припадаючи на 1,4 (з 60% точністю перевірки). Я перемістив …

11 neural-networks conv-neural-network keras

2

Чи може згорткова нейронна мережа приймати як вхідні зображення різних розмірів?

Я працюю в мережі згортки для розпізнавання зображень, і мені було цікаво, чи можу я вводити зображення різного розміру (хоча не дуже різного). Про цей проект: https://github.com/harvardnlp/im2markup Вони кажуть: and group images of similar sizes to facilitate batching Тож навіть після попередньої обробки зображення все ще мають різні розміри, що …

10 neural-networks conv-neural-network computer-vision

4

різниця між нейронною мережею та глибоким навчанням

З точки зору різниці між нейронною мережею та глибоким навчанням, ми можемо перелічити декілька предметів, таких як включено більше шарів, масивний набір даних, потужне комп'ютерне обладнання, щоб зробити навчання складною моделлю можливою. Окрім них, чи є більш детальне пояснення щодо різниці між NN та DL?

10 machine-learning neural-networks deep-learning conv-neural-network deep-belief-networks

2

Чи графічні моделі та машини Больцмана пов'язані математично?

Хоча я фактично займався програмуванням з машинами Больцмана на уроці фізики, я не знайомий з їх теоретичною характеристикою. Навпаки, я знаю скромну кількість про теорію графічних моделей (про перші кілька розділів книги « Графічні моделі» Лаурітцена ). Запитання: Чи є якісь змістовні зв’язки між графічними моделями та машиною Больцмана? Чи …

10 machine-learning neural-networks mathematical-statistics graphical-model rbm

1

Співвідношення між швидкістю навчання та кількістю прихованих шарів?

Чи є якесь правило між глибиною нейронної мережі та швидкістю навчання? Я помічав, що чим глибше мережа, тим нижчим повинен бути рівень навчання. Якщо це правильно, чому це так?

10 neural-networks deep-learning hyperparameter rule-of-thumb

3

Чи можна навчити нейронну мережу малювати зображення в певному стилі?

Чи можна навчити нейронну мережу малювати зображення в певному стилі? (Отже, він знімає зображення і перемальовує його у стилі, для якого він був навчений.) Чи є якась затверджена технологія для такого роду речі? Я знаю про алгоритм DeepArt. Добре заповнити основне зображення певним малюнком (наприклад, vangoghify image), але я шукаю …

10 machine-learning neural-networks deep-learning

1

Чи нейронні мережі зазвичай потребують певного часу, щоб "піднятися" під час тренувань?

Я намагаюся навчити глибоку нейронну мережу для класифікації, використовуючи зворотне поширення. Зокрема, я використовую звивисту нейронну мережу для класифікації зображень, використовуючи бібліотеку потоків тензорів. Під час тренувань я відчуваю якусь дивну поведінку, і мені просто цікаво, чи це типово, чи я можу робити щось не так. Отже, моя конволюційна нейронна …

10 machine-learning classification neural-networks conv-neural-network tensorflow

Запитання з тегом «neural-networks»