Запитання з тегом «keras»

Бібліотека нейронних мереж високого рівня з відкритим кодом для Python та R. Можливо використовувати TensorFlow або Theano як серверну систему.

4
Який розмір партії в нейронній мережі?
Я використовую Python Keras packageдля нейронної мережі. Це посилання . Чи batch_sizeдорівнює кількості тестових зразків? З Вікіпедії ми маємо цю інформацію: Однак в інших випадках для оцінки градієнта суми можуть знадобитися дорогі оцінки градієнтів з усіх функцій підсумовування. Коли навчальний набір величезний і не існує простих формул, оцінка сум градієнтів …

2
Як працює шар "Вбудовування" Кераса?
Потрібно зрозуміти, як працює шар «Вбудовування» у бібліотеці Кераса. Я виконую наступний код у Python import numpy as np from keras.models import Sequential from keras.layers import Embedding model = Sequential() model.add(Embedding(5, 2, input_length=5)) input_array = np.random.randint(5, size=(1, 5)) model.compile('rmsprop', 'mse') output_array = model.predict(input_array) що дає наступний вихід input_array = [[4 …

5
Яка функція втрати для багатокласних завдань з класифікацією на багато міток у нейронних мережах?
Я треную нейронну мережу для класифікації набору об'єктів на n-класи. Кожен об'єкт може належати одночасно до декількох класів (багатокласний, багатозначний). Я читав, що для проблем із класом зазвичай рекомендується використовувати softmax та категоричну перехресну ентропію як функцію втрати замість mse, і я розумію більш-менш чому. У моїй проблемі мульти-етикетки не …

5
Як зробити свою нейронну мережу кращою при прогнозуванні синусоїд?
Ось подивіться: Ви можете точно бачити, де закінчуються дані тренувань. Дані про навчання проходять від до .−1−1-1111 Я використовував Keras і щільну мережу 1-100-100-2 з активацією tanh. Я обчислюю результат з двох значень, p і q як p / q. Таким чином я можу отримати будь-який розмір числа, використовуючи лише …

3
Розуміння параметра input_shape в LSTM з Keras
Я намагаюся використовувати приклад, описаний в документації Keras під назвою "Складений LSTM для класифікації послідовностей" (див. Код нижче) і не можу визначити input_shapeпараметр у контексті моїх даних. Я маю на увазі матрицю послідовностей з 25 можливих символів, закодованих цілими числами, до вкладеної послідовності максимальної довжини 31. В результаті мій x_trainмає …
20 lstm  keras  shape  dimensions 

4
Чим відрізняється Conv1D від Conv2D?
Я переглядав документи про згортку keras і знайшов два типи конвультури Conv1D і Conv2D. Я здійснив деякий пошук в Інтернеті, і це те, що я розумію про Conv1D та Conv2D; Conv1D використовується для послідовностей, а Conv2D - для зображень. Я завжди думав, що звивисті нервові мережі використовуються лише для зображень …

4
Чи можна надати зображення змінного розміру як вхід до згорткової нейронної мережі?
Чи можемо ми дати зображення із змінним розміром як вхід у згорнуту нейронну мережу для виявлення об'єктів? Якщо можливо, як це зробити? Але якщо ми спробуємо обрізати зображення, ми втратимо частину зображення, а якщо спробуємо змінити розмір, то чіткість зображення буде втрачена. Чи означає це, що використання властивості властивості мережі …

1
Чому жоден ReLU не може вивчити RELU?
У процесі моєї нейронної мережі навіть не можна вивчити евклідову відстань, я ще більше спростив і спробував навчити один РеЛУ (з випадковою вагою) до одного РеЛУ. Це найпростіша мережа, яка є, і все ж половину часу вона не зможе конвергуватися. Якщо початкова здогадка має таку саму орієнтацію, що і ціль, …

2
Як дресирується шар вбудовування в шар Keras Embedding
Як навчається шар вбудовування в шар вбудовування Keras? (скажімо, використовуючи заголовок tensorflow, тобто це схоже на word2vec, рукавичку або швидкий текст) Припустимо, ми не використовуємо перевірене вбудовування.

3
CIFAR-10 Не може перевищити 60% точності, Керас із Tensorflow backkend [закрито]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закритий минулого року . Навчання після 15 епох на наборі даних CIFAR-10, схоже, втрати валідації більше не зменшуються, припадаючи на 1,4 (з 60% точністю перевірки). Я перемістив …

1
Моя нейронна мережа навіть не може вивчити евклідову відстань
Тому я намагаюся навчити себе нейронних мереж (для регресійних застосувань, а не для класифікації зображень котів). Першими моїми експериментами було навчання мережі для впровадження фільтра FIR та дискретної трансформації Фур'є (тренування сигналів "до" та "після"), оскільки це обидві лінійні операції, які можуть бути реалізовані одним шаром без функції активації. Обидва …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.