Запитання з тегом «neural-network»

Штучні нейронні мережі (ANN) складаються з «нейронів» - програмуючих конструкцій, що імітують властивості біологічних нейронів. Набір зважених зв’язків між нейронами дозволяє поширювати інформацію через мережу для вирішення проблем штучного інтелекту, без того, щоб дизайнер мережі мав модель реальної системи.

1
Як слід ініціалізувати і регулювати упередження?
Я прочитав пару статей про ініціалізацію ядра, і багато робіт згадують, що вони використовують регуляризацію ядра L2 (часто з ).λ = 0,0001λ=0.0001\lambda = 0.0001 Хтось робить щось інше, ніж ініціалізувати зміщення з постійним нулем і не регулювати його? Папери ініціалізації ядра Мішкін і Матас: Все, що вам потрібно, - це …

3
Чи мають нейронні мережі пояснення, як це роблять дерева рішень?
У Деревах рішень ми можемо зрозуміти вихідну структуру дерева, а також можемо уявити, як Дерево рішень приймає рішення. Тому дерева рішень мають пояснення (їх вихід можна пояснити легко.) Чи є у нас пояснення в нейронних мережах, як у деревах рішень?

1
Забудьте прошарок у періодичній нейронній мережі (RNN) -
Я намагаюся з'ясувати розміри кожної змінної в RNN в шарі забуття, однак я не впевнений, чи я на правильному шляху. Наступна картина та рівняння - з публікації блогу Кола "Розуміння мереж LSTM" : де: є введення розміру м * 1 векторхтxtx_tm ∗ 1m∗1m*1 - прихований стан розміру n ∗ 1 …

3
Чим НН з глибоким навчанням зараз (2016) відрізняються від тих, які я вивчав лише 4 роки тому (2012)?
У Вікіпедії та deepplearning4j кажуть, що глибоко вивчаючий NN (DLNN) - це NN, які мають> 1 прихований шар. Такі види NN були стандартними для мене в університеті, тоді як DLNN зараз дуже розкручений. Був там, робив це - в чому ж велика справа? Я також чув, що складені NN вважаються …

2
Чи є можливість змінити показник, використаний при зворотному зупинці виклику в Керасі?
Під час використання зворотного виклику раннього припинення в навчанні Keras припиняється, коли деяка метрика (зазвичай втрата валідації) не збільшується. Чи існує спосіб використання іншої метрики (як точність, нагадування, вимірювання f) замість втрати перевірки? Усі приклади, які я бачив до цього часу, схожі на цей: callbacks.EarlyStopping (monitor = 'val_loss', терпіння = …

1
То в чому спіймана LSTM?
Я розширюю свої знання щодо пакету Keras і оснащую деякі доступні моделі. У мене є проблема бінарної класифікації NLP, яку я намагаюся вирішити і застосовую різні моделі. Працюючи з деякими результатами і читаючи все більше і більше про LSTM, здається, що цей підхід є набагато кращим за все, що я …

1
Багатозавдання навчання в Керасі
Я намагаюся реалізувати спільні шари в Керасі. Я бачу, що у Кераса є keras.layers.concatenate, але я не впевнений у документації про його використання. Чи можу я використовувати його для створення декількох загальних шарів? Який був би найкращий спосіб реалізувати просту спільну нейронну мережу, як показано нижче, використовуючи Keras? Зауважте, що …

5
Найкраща бібліотека Джулії для нейронних мереж
Я використовую цю бібліотеку для основної побудови та аналізу нейронної мережі. Однак він не має підтримки для побудови багатошарових нейронних мереж тощо. Отже, я хотів би знати про будь-які приємні бібліотеки для роботи з розвиненими нейронними мережами та Deep Learning у Джулії.

2
Чи може нейронна мережа обчислити
В дусі відомого жарту Tensorflow Fizz Buzz і проблеми XOr я задумався, чи можливо створити нейронну мережу, яка реалізує функцію ?у= х2у=х2y = x^2 Враховуючи деяке подання числа (наприклад, як вектор у двійковій формі, так що це число 5представлене як [1,0,1,0,0,0,0,...]), нейронна мережа повинна навчитися повертати свій квадрат - 25 …

3
Чи існує правило для створення дизайну нейронних мереж?
Я знаю, що нейромережева архітектура здебільшого базується на самій проблемі та типах введення / виводу, але все ж - завжди є "квадратний", коли він починає будувати. Отже, моє запитання - з урахуванням вхідного набору даних MxN (M - кількість записів, N - кількість особливостей) та C можливих вихідних класів - …

4
Як знати, що модель почала переозброювати?
Я сподіваюся, що наступні уривки дадуть зрозуміти, про що піде моє питання. Це з http://neuralnetworksanddeeplearning.com/chap3.html Потім навчання поступово сповільнюється. Нарешті, приблизно в епоху 280 точність класифікації в значній мірі перестає покращуватися. Пізніші епохи просто бачать невеликі стохастичні коливання поблизу значення точності в епоху 280. Порівнюйте це з попереднім графіком, де …

2
Скільки зображень у класі достатньо для навчання CNN
Я починаю проект, де завданням є визначення типів кросівок із зображень. На даний момент я читаю про реалізацію TensorFlow та Torch . Моє запитання: скільки зображень для кожного класу потрібно для досягнення розумної ефективності класифікації?

2
Моделювання нерівномірно розташованих часових рядів
Я маю суцільну змінну, відібрану вибірку протягом року з нерегулярними інтервалами. Деякі дні мають більше одного спостереження на годину, а інші періоди нічого не мають. Це ускладнює виявлення закономірностей у часових рядах, оскільки деякі місяці (наприклад, жовтень) є дуже вибірковою, а інші - ні. Моє питання - який найкращий підхід …

1
Скільки клітин LSTM я повинен використовувати?
Чи є якісь правила (чи фактичні правила), що стосуються мінімальної, максимальної та "розумної" кількості комірок LSTM, які я повинен використовувати? Зокрема, я стосуюсь BasicLSTMCell від TensorFlow та num_unitsвласності. Будь ласка, припустіть, що у мене проблема класифікації, визначена: t - number of time steps n - length of input vector in …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 

2
Що таке гаряче кодування в tensorflow?
Зараз я проходжу курс з tensorflow, в якому вони використовували tf.one_hot (індекси, глибина). Тепер я не розумію, як ці індекси змінюються на цю двійкову послідовність. Може хтось, будь ласка, пояснить мені точний процес ???

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.