Запитання з тегом «deep-learning»

нова область досліджень машинного навчання, що стосується технологій, що використовуються для вивчення ієрархічних уявлень даних, в основному це робиться з глибокими нейронними мережами (тобто мережами з двома або більше прихованими шарами), а також з деякими імовірнісними графічними моделями.

1
Чому ReLU кращий за інші функції активації
Тут відповідь стосується зникаючих та вибухових градієнтів, які були у sigmoidподібних функціях активації, але, я думаю, Reluмає недолік, і це його очікуване значення. немає обмежень на вихід Reluта, тому його очікуване значення не дорівнює нулю. Я пам'ятаю час , перш ніж популярність , Reluщо tanhбув найпопулярнішим серед машинного навчання фахівців …

3
Баггінг проти випадання в глибоких нейронних мережах
Баггінг - це покоління декількох предикторів, яке працює так само симпатично, як і єдиний провісник. Випадання - це техніка, яка привчає нейронні мережі до порівняння всіх можливих підмереж. Дивлячись на найважливіші змагання Kaggle, здається, що ці дві техніки використовуються разом дуже часто. Я не бачу жодної теоретичної різниці, окрім реальної …

3
Як обчислити вплив міні-пакетної пам'яті при навчанні моделей глибокого навчання?
Я намагаюся обчислити об'єм пам'яті, необхідний GPU для підготовки моєї моделі на основі цієї замітки Андрія Карфати: http://cs231n.github.io/convolutional-networks/#computational-considerations Моя мережа має 532,752 активації та 19,072,984 параметрів (ваги та ухили). Це всі 32-бітні значення поплавків, тому кожен займає 4 байти в пам'яті. Моє вхідне зображення - 180х50х1 (ширина х висота х …

5
збільшують теплову карту для новонароджених
Я створюю corr()df з оригінального df. corr()ДФ вийшов 70 X 70 і неможливо уявити собі Heatmap ... sns.heatmap(df). Якщо я спробую відобразити corr = df.corr()таблицю, таблиця не відповідає екрану, і я бачу всі кореляції. Це спосіб або надрукувати весь, dfнезалежно від його розміру, або контролювати розмір теплової карти?
17 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

2
Чи слід застосовувати нормалізацію і для тестування даних?
Я роблю проект з проблеми ідентифікації автора. Я застосував нормалізацію tf-idf для підготовки даних, а потім навчив SVM для цих даних. Тепер при використанні класифікатора слід нормалізувати і тестові дані. Я вважаю, що основна мета нормалізації - зробити так, щоб навчальне альго надавало більшої ваги важливішим особливостям під час навчання. …

5
Переобладнання конвертної нейронної мережі. Випадання не допомагає
Я трохи граю з конвенцями. Зокрема, я використовую набір даних кангл-котів проти собак, який складається з 25000 зображень, позначених як кішка або собака (12500 у кожному). Мені вдалося досягти близько 85% точності класифікації на моєму тестовому наборі, проте я поставив мету досягти 90% точності. Моя головна проблема - це надмірне …

3
Що таке вага та упередженість у глибокому навчанні?
Я починаю вивчати машинне навчання з веб-сайту Tensorflow. Я розробив дуже рудиментарне розуміння потоку, за яким слідує програма глибокого навчання (цей метод змушує мене швидко вчитися, а не читати книги та великі статті). Я натрапив на кілька заплутаних речей, з них 2: Упередження Вага У навчальному посібнику MNIST на веб-сайті …

3
Як отримати прогнози за допомогою predict_generator на потокових тестових даних у Керасі?
У блозі Кераса, який навчає коннетів з нуля , код показує лише мережу, що працює на даних про навчання та перевірку. Що з тестовими даними? Чи збігаються дані перевірки як дані тестування (я думаю, що ні). Якщо в папках поїзда та валідації була окрема тестова папка, схожа на теки поїздів …


2
Параметризаційна регресія кута повороту
Скажімо, у мене зображення стрілки зверху вниз, і я хочу передбачити кут цієї стрілки. Це буде від до 360 градусів, або від 0 до 2 π . Проблема полягає в тому, що ця ціль кругла, 0 і 360 градусів точно така ж, і це інваріантність, яку я хотів би включити …

3
Як додати нову категорію до моделі глибокого навчання?
Скажіть, я переклав навчання за попередньо підготовленою мережею, щоб розпізнати 10 об’єктів. Як додати 11-й елемент, який мережа може класифікувати, не втрачаючи всіх 10 категорій, які я вже навчив, а також інформацію з оригінальної попередньо підготовленої моделі? Друг сказав мені, що в цій галузі проводяться активні дослідження, але я не …

1
PyTorch проти Tensorflow прагне
Нещодавно компанія Google, включена в нічну кількість тензорфлоу, створює свій режим Eager , необхідний API для доступу до можливостей обчислення tensorflow. Як tensorflow нетерплячий порівняти з PyTorch? Деякі аспекти, які можуть вплинути на порівняння, можуть бути: Переваги та недоліки охочих завдяки його статичній графічній спадщині (наприклад, імена у вузлах). Внутрішні …

4
Чи можемо ми створити величезний набір даних за допомогою генеративних рекламних мереж
Я маю справу з проблемою, коли мені не вдалося знайти достатньо набору даних (зображень), щоб подати в мою глибоку нейронну мережу для тренувань. Мене настільки надихнув документ "Генеральний змагальний текст для синтезу зображень", опублікований Скоттом Рідом та ін. про генеративні змагальні мережі. Мені було цікаво знати, чи можу я використовувати …

1
Як додати функції зображень, що не належать до зображень, поруч із зображеннями бік як вхід CNN
Я треную конволюційну нейронну мережу для класифікації зображень за умовами туману (3 класи). Однак для кожного з приблизно 150 000 зображень у мене також є чотири метеорологічні змінні, які можуть допомогти передбачити класи зображень. Мені було цікаво, як я можу додати метеорологічні змінні (наприклад, температуру, швидкість вітру) до існуючої структури …

3
Чи є клас особи в ImageNet? Чи є заняття, пов’язані з людиною?
Якщо я перегляну одне з багатьох джерел для класів Imagenet в Інтернеті, я не можу знайти жодного класу, пов’язаного з людьми (і ні, жнивець - це не той, хто збирає урожай, але це те, що я знав, як тато довгі ноги, такий собі павук :-). Як це можливо? Я б, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.