Програмування neural-network

20

Мені відомо про спуск градієнта та алгоритм розповсюдження назад. Що я не розумію: коли важливо використовувати ухил і як ви його використовуєте? Наприклад, коли відображається ANDфункція, коли я використовую 2 входи та 1 вихід, вона не дає правильних ваг, однак, коли я використовую 3 входи (1 з яких є зміщенням), …

806 machine-learning neural-network artificial-intelligence backpropagation

13

Епоха проти ітерації при навчанні нейронних мереж

Яка різниця між епохою та ітерацією при навчанні багатошарового перцептрона?

413 machine-learning neural-network deep-learning artificial-intelligence terminology

6

Які переваги штучних нейронних мереж над підтримуючими векторними машинами? [зачинено]

Наразі це запитання не підходить для нашого формату запитань. Ми очікуємо, що відповіді будуть підкріплені фактами, посиланнями або експертними знаннями, але це питання, ймовірно, вимагатиме дискусій, аргументів, опитувань чи розширеної дискусії. Якщо ви вважаєте, що це питання можна вдосконалити та, можливо, знову відкрити, відвідайте довідковий центр для ознайомлення . Закрито …

381 machine-learning neural-network classification svm

1

Навчальні нейронні мережі виявляють надзвичайно малі значення NaN

Я намагаюся реалізувати архітектуру нейронної мережі в Haskell і використовувати її на MNIST. Я використовую hmatrixпакет для лінійної алгебри. Моя навчальна база побудована за допомогою pipesпакету. Мій код компілюється і не дає збою. Але проблема полягає в тому, що певні комбінації розміру шару (скажімо, 1000), розміру міні-партії та швидкості навчання …

329 algorithm haskell neural-network backpropagation

2

Пояснення введення Keras: вхідна форма, одиниці, batch_size, затемнення тощо

Для будь-якого шару Keras ( Layerклас), може хто - то пояснити , як зрозуміти різницю між input_shape, units, dimі т.д.? Наприклад, доктор говорить, unitsзадайте форму виводу шару. На зображенні нейронна сітка внизу hidden layer1має 4 одиниці. Чи це безпосередньо перекладається на unitsатрибут Layerоб’єкта? Або unitsв Керасі однакова форма кожної ваги …

261 neural-network deep-learning keras keras-layer tensor

11

Яке значення слова logits у TensorFlow?

У наступній функції TensorFlow ми повинні подати активацію штучних нейронів у заключному шарі. Це я розумію. Але я не розумію, чому це називається logits? Це не математична функція? loss_function = tf.nn.softmax_cross_entropy_with_logits( logits = last_layer, labels = target_output )

250 tensorflow machine-learning neural-network deep-learning cross-entropy

3

Як інтерпретувати "втрату" та "точність" для моделі машинного навчання

Коли я тренував свою нейронну мережу разом із Теано чи Тенсдорфлоу, вони повідомлятимуть про змінну під назвою "втрата" за епоху. Як слід інтерпретувати цю змінну? Чим більше втрати, тим краще чи гірше, або що це означає для остаточної продуктивності (точності) моєї нейронної мережі?

201 machine-learning neural-network mathematical-optimization deep-learning objective-function

7

Де я називаю функцію BatchNormalization в Керасі?

Якщо я хочу використовувати функцію BatchNormalization в Keras, то чи потрібно мені викликати її один раз лише на початку? Я читав цю документацію на неї: http://keras.io/layers/normalization/ Я не бачу, куди мені це потрібно дзвонити. Нижче наведено мій код, який намагається використовувати його: model = Sequential() keras.layers.normalization.BatchNormalization(epsilon=1e-06, mode=0, momentum=0.9, weights=None) model.add(Dense(64, …

167 python keras neural-network data-science batch-normalization

11

Чому binary_crossentropy та categorical_crossentropy дають різні вистави для однієї проблеми?

Я намагаюся навчити CNN класифікувати текст за темами. Коли я використовую бінарну перехресну ентропію, я отримую ~ 80% точності, при категоричній перехресній ентропії я отримую ~ 50% точності. Я не розумію, чому це. Це багатокласова проблема, чи це не означає, що я повинен використовувати категоричну перехресну ентропію і що результати …

160 machine-learning keras neural-network deep-learning conv-neural-network

9

Навіщо використовувати softmax на відміну від стандартної нормалізації?

У вихідному шарі нейронної мережі типово використовувати функцію softmax для наближення розподілу ймовірностей: Це обчислити дорого через показники. Чому б просто не виконати перетворення Z так, щоб усі результати були позитивними, а потім нормалізувались, поділивши всі результати на суму всіх результатів?

159 math neural-network softmax

7

Яка різниця між поїздом, валідацією та тестовим набором у нейронних мережах?

Я використовую цю бібліотеку для реалізації агента навчання. Я створив випадки навчання, але не знаю напевно, що таке набори перевірки та тестування. Вчитель каже: 70% мають бути випадками поїздів, 10% - тестовими, а решта - 20%. редагувати У мене є цей код для тренувань, але я поняття не маю, коли …

155 artificial-intelligence neural-network

9

Чому нам доводиться нормалізувати вхід для штучної нейронної мережі?

Це головне питання щодо теорії нейронних мереж: Чому ми повинні нормалізувати вхід для нейронної мережі? Я розумію, що іноді, коли, наприклад, вхідні значення є нечисловими, потрібно здійснити певне перетворення, але коли у нас є числовий вхід? Чому числа повинні бути в певному інтервалі? Що буде, якщо дані не нормалізуються?

151 tensorflow machine-learning neural-network normalization

8

Коли я повинен використовувати генетичні алгоритми на відміну від нейронних мереж? [зачинено]

Наразі це запитання не підходить для нашого формату запитань. Ми очікуємо, що відповіді будуть підкріплені фактами, посиланнями або експертними знаннями, але це питання, ймовірно, вимагатиме дискусій, аргументів, опитувань чи розширеної дискусії. Якщо ви вважаєте, що це питання можна вдосконалити та, можливо, знову відкрити, відвідайте довідковий центр для ознайомлення . Закрито …

139 artificial-intelligence machine-learning neural-network genetic-algorithm

7

Як навчити штучну нейронну мережу грати в Diablo 2 за допомогою візуального введення?

Наразі я намагаюся отримати АНН, щоб грати у відеоігри, і я сподівався отримати допомогу чудового співтовариства тут. Я зупинився на Diablo 2. Гра, таким чином, відбувається в режимі реального часу і з ізометричної точки зору, при цьому гравець управляє одним аватаром, на якому орієнтована камера. Щоб зробити конкретні речі, завдання …

139 machine-learning computer-vision neural-network video-processing reinforcement-learning

12

Чому нелінійну функцію активації слід використовувати в нейронній мережі зворотного розповсюдження?

Я читав деякі речі в нейронних мережах і розумію загальний принцип одношарової нейронної мережі. Я розумію необхідність додаткових шарів, але чому використовуються нелінійні функції активації? Після цього питання йде наступне : Що таке похідна функції активації, яка використовується для зворотного розповсюдження?

139 math machine-learning neural-network deep-learning

Запитання з тегом «neural-network»