Запитання з тегом «neural-network»

Штучні нейронні мережі (ANN) складаються з «нейронів» - програмуючих конструкцій, що імітують властивості біологічних нейронів. Набір зважених зв’язків між нейронами дозволяє поширювати інформацію через мережу для вирішення проблем штучного інтелекту, без того, щоб дизайнер мережі мав модель реальної системи.

4
Word2Vec для іменного розпізнавання особи
Я хочу використовувати реалізацію google word2vec для побудови названої системи розпізнавання сутностей. Я чув, що рекурсивні нейронні мережі з поширенням назад через структуру добре підходять для названих завдань розпізнавання об'єктів, але мені не вдалося знайти гідної реалізації або гідного підручника для цього типу моделі. Оскільки я працюю з нетиповим корпусом, …

3
Чому громади NLP та машинного навчання зацікавлені у глибокому навчанні?
Сподіваюся, ви можете мені допомогти, оскільки у мене є деякі запитання на цю тему. Я новачок у галузі глибокого навчання, і хоча я робив кілька навчальних посібників, я не можу співвідносити чи відрізняти поняття одне від одного.

3
Чим відрізняється градієнтний спуск від стохастичного градієнтного спуску?
Чим відрізняється градієнтний спуск від стохастичного градієнтного спуску? Я не дуже знайомий з цими, чи можете ви описати різницю на короткому прикладі?

6
Чому працюють конволюційні нейронні мережі?
Я часто чув людей, які говорять про те, чому конволюційні нейронні мережі ще недостатньо вивчені. Чи відомо, чому нейромережі, що розвиваються, завжди отримують все більш досконалі функції, коли ми піднімаємося по шарах? Що змусило їх створити такий набір функцій і чи це би було справедливо і для інших типів глибоких …

2
Як обчислити mAP для завдання виявлення для виклику PASCAL VOC?
Як обчислити mAP (середню середню точність) для завдання виявлення для лідерів Pascal VOC? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Там сказано - на сторінці 11 : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf Середня точність (AP). Для виклику VOC2007 була використана інтерпольована середня точність (Salton and Mcgill 1986) для оцінки як класифікації, так і виявлення. Для заданого завдання та класу крива …

4
Як отримати точність, F1, точність та відкликання для моделі кераса?
Я хочу обчислити точність, відкликання та показник F1 для моєї бінарної моделі KerasClassifier, але не знаходжу жодного рішення. Ось мій фактичний код: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() model.add(Dense(23, input_dim=45, kernel_initializer='normal', activation='relu')) …

1
Чи є правила вибору розміру міні-партії?
При тренуванні нейронних мереж один гіперпараметр має розмір міні-партії. Поширені варіанти - 32, 64 та 128 елементів на міні-партію. Чи є якісь правила / настанови, якою має бути міні-партія? Будь-які публікації, які досліджують вплив на навчання?

3
Нейронна мережа для декількох вихідних регресій
У мене є набір даних, що містить 34 колонки введення та 8 вихідних стовпців. Один із способів вирішити проблему - взяти 34 входи та побудувати індивідуальну модель регресії для кожного вихідного стовпчика. Мені цікаво, чи можна вирішити цю проблему за допомогою лише однієї моделі, особливо за допомогою нейронної мережі. Я …

4
Чи завжди спуск градієнта до оптимального?
Мені цікаво, чи є сценарій, коли спуск градієнта не зближується до мінімуму. Я усвідомлюю, що спуск градієнта не завжди гарантується для сходу до глобального оптимуму. Я також усвідомлюю, що це може відрізнятися від оптимального, якщо, скажімо, розмір кроку занадто великий. Однак мені здається, що якщо воно буде відходити від якогось …

2
Sparse_categorical_crossentropy vs categorical_crossentropy (кери, точність)
Що краще для точності чи вони однакові? Звичайно, якщо ви використовуєте categorical_crossentropy, ви використовуєте одне гаряче кодування, а якщо ви використовуєте sparse_categorical_crossentropy, ви кодуєте як звичайні цілі числа. Крім того, коли один кращий за іншого?


3
Вилучення ключового слова / фрази з тексту за допомогою бібліотек Deep Learning
Можливо, це занадто широко, але я шукаю посилання на те, як використовувати глибоке навчання у завданні підбиття тексту. Я вже реалізував узагальнення тексту, використовуючи стандартні підходи до частоти слів і ранжування речень, але я хотів би вивчити можливість використання методів глибокого навчання для цього завдання. Я також пройшов кілька реалізацій, …

1
Як вирішити архітектуру нейронної мережі?
Мені було цікаво, як нам вирішити, скільки вузлів у прихованих шарах і скільки прихованих шарів поставити, коли ми будуємо архітектуру нейронної мережі. Я розумію, що рівень введення та виведення залежить від навчального набору, який ми маємо, але як ми вирішуємо прихований шар та загальну архітектуру взагалі?

2
Чому ReLU використовується як функція активації?
Функції активації використовуються для введення нелінійностей у лінійний вихід типу w * x + bв нейронній мережі. Який я здатний зрозуміти інтуїтивно для таких функцій активації, як сигмоїд. Я розумію переваги ReLU, яка уникає мертвих нейронів під час розмноження. Однак я не в змозі зрозуміти, чому ReLU використовується як функція …

4
Яке значення "Кількість одиниць у комірці LSTM"?
З коду Tensorflow : Tensorflow. RnnCell num_units: int, The number of units in the LSTM cell. Не можу відкинути, що це означає. Назвіть одиниці комірки LSTM. Вхідні, вихідні та забуті ворота? Чи означає це "кількість одиниць у шарі періодичного проектування для Deep LSTM". Тоді чому це називається "кількість одиниць у …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.