Запитання з тегом «neural-network»

Мережева структура натхненна спрощеними моделями біологічних нейронів (клітини мозку). Нейронні мережі навчаються "навчатися" під контрольованими та непідконтрольними методами, і їх можна використовувати для вирішення задач оптимізації, проблем наближення, класифікації шаблонів та їх комбінацій.

20
Яка роль зміщення в нейронних мережах?
Мені відомо про спуск градієнта та алгоритм розповсюдження назад. Що я не розумію: коли важливо використовувати ухил і як ви його використовуєте? Наприклад, коли відображається ANDфункція, коли я використовую 2 входи та 1 вихід, вона не дає правильних ваг, однак, коли я використовую 3 входи (1 з яких є зміщенням), …


6
Які переваги штучних нейронних мереж над підтримуючими векторними машинами? [зачинено]
Наразі це запитання не підходить для нашого формату запитань. Ми очікуємо, що відповіді будуть підкріплені фактами, посиланнями або експертними знаннями, але це питання, ймовірно, вимагатиме дискусій, аргументів, опитувань чи розширеної дискусії. Якщо ви вважаєте, що це питання можна вдосконалити та, можливо, знову відкрити, відвідайте довідковий центр для ознайомлення . Закрито …

1
Навчальні нейронні мережі виявляють надзвичайно малі значення NaN
Я намагаюся реалізувати архітектуру нейронної мережі в Haskell і використовувати її на MNIST. Я використовую hmatrixпакет для лінійної алгебри. Моя навчальна база побудована за допомогою pipesпакету. Мій код компілюється і не дає збою. Але проблема полягає в тому, що певні комбінації розміру шару (скажімо, 1000), розміру міні-партії та швидкості навчання …

2
Пояснення введення Keras: вхідна форма, одиниці, batch_size, затемнення тощо
Для будь-якого шару Keras ( Layerклас), може хто - то пояснити , як зрозуміти різницю між input_shape, units, dimі т.д.? Наприклад, доктор говорить, unitsзадайте форму виводу шару. На зображенні нейронна сітка внизу hidden layer1має 4 одиниці. Чи це безпосередньо перекладається на unitsатрибут Layerоб’єкта? Або unitsв Керасі однакова форма кожної ваги …

11
Яке значення слова logits у TensorFlow?
У наступній функції TensorFlow ми повинні подати активацію штучних нейронів у заключному шарі. Це я розумію. Але я не розумію, чому це називається logits? Це не математична функція? loss_function = tf.nn.softmax_cross_entropy_with_logits( logits = last_layer, labels = target_output )

3
Як інтерпретувати "втрату" та "точність" для моделі машинного навчання
Коли я тренував свою нейронну мережу разом із Теано чи Тенсдорфлоу, вони повідомлятимуть про змінну під назвою "втрата" за епоху. Як слід інтерпретувати цю змінну? Чим більше втрати, тим краще чи гірше, або що це означає для остаточної продуктивності (точності) моєї нейронної мережі?

7
Де я називаю функцію BatchNormalization в Керасі?
Якщо я хочу використовувати функцію BatchNormalization в Keras, то чи потрібно мені викликати її один раз лише на початку? Я читав цю документацію на неї: http://keras.io/layers/normalization/ Я не бачу, куди мені це потрібно дзвонити. Нижче наведено мій код, який намагається використовувати його: model = Sequential() keras.layers.normalization.BatchNormalization(epsilon=1e-06, mode=0, momentum=0.9, weights=None) model.add(Dense(64, …

11
Чому binary_crossentropy та categorical_crossentropy дають різні вистави для однієї проблеми?
Я намагаюся навчити CNN класифікувати текст за темами. Коли я використовую бінарну перехресну ентропію, я отримую ~ 80% точності, при категоричній перехресній ентропії я отримую ~ 50% точності. Я не розумію, чому це. Це багатокласова проблема, чи це не означає, що я повинен використовувати категоричну перехресну ентропію і що результати …

9
Навіщо використовувати softmax на відміну від стандартної нормалізації?
У вихідному шарі нейронної мережі типово використовувати функцію softmax для наближення розподілу ймовірностей: Це обчислити дорого через показники. Чому б просто не виконати перетворення Z так, щоб усі результати були позитивними, а потім нормалізувались, поділивши всі результати на суму всіх результатів?

7
Яка різниця між поїздом, валідацією та тестовим набором у нейронних мережах?
Я використовую цю бібліотеку для реалізації агента навчання. Я створив випадки навчання, але не знаю напевно, що таке набори перевірки та тестування. Вчитель каже: 70% мають бути випадками поїздів, 10% - тестовими, а решта - 20%. редагувати У мене є цей код для тренувань, але я поняття не маю, коли …

9
Чому нам доводиться нормалізувати вхід для штучної нейронної мережі?
Це головне питання щодо теорії нейронних мереж: Чому ми повинні нормалізувати вхід для нейронної мережі? Я розумію, що іноді, коли, наприклад, вхідні значення є нечисловими, потрібно здійснити певне перетворення, але коли у нас є числовий вхід? Чому числа повинні бути в певному інтервалі? Що буде, якщо дані не нормалізуються?

8
Коли я повинен використовувати генетичні алгоритми на відміну від нейронних мереж? [зачинено]
Наразі це запитання не підходить для нашого формату запитань. Ми очікуємо, що відповіді будуть підкріплені фактами, посиланнями або експертними знаннями, але це питання, ймовірно, вимагатиме дискусій, аргументів, опитувань чи розширеної дискусії. Якщо ви вважаєте, що це питання можна вдосконалити та, можливо, знову відкрити, відвідайте довідковий центр для ознайомлення . Закрито …

7
Як навчити штучну нейронну мережу грати в Diablo 2 за допомогою візуального введення?
Наразі я намагаюся отримати АНН, щоб грати у відеоігри, і я сподівався отримати допомогу чудового співтовариства тут. Я зупинився на Diablo 2. Гра, таким чином, відбувається в режимі реального часу і з ізометричної точки зору, при цьому гравець управляє одним аватаром, на якому орієнтована камера. Щоб зробити конкретні речі, завдання …

12
Чому нелінійну функцію активації слід використовувати в нейронній мережі зворотного розповсюдження?
Я читав деякі речі в нейронних мережах і розумію загальний принцип одношарової нейронної мережі. Я розумію необхідність додаткових шарів, але чому використовуються нелінійні функції активації? Після цього питання йде наступне : Що таке похідна функції активації, яка використовується для зворотного розповсюдження?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.