Запитання з тегом «deep-learning»

нова область досліджень машинного навчання, що стосується технологій, що використовуються для вивчення ієрархічних уявлень даних, в основному це робиться з глибокими нейронними мережами (тобто мережами з двома або більше прихованими шарами), а також з деякими імовірнісними графічними моделями.

3
Multi GPU в керах
Як ви можете запрограмувати в бібліотеці керас (або тензорфлоу) для навчання розділів на декількох графічних процесорах? Скажімо, ви знаходитесь в екземплярі Amazon ec2, який має 8 графічних процесорів, і ви хочете використовувати їх для швидшого тренування, але ваш код призначений лише для одного процесора або GPU.

4
Інтуїтивне пояснення втрат протишумної оцінки (NCE)?
Я читав про NCE (форму вибірки кандидатів) з цих двох джерел: Тенсдорфловський запис Оригінальний папір Чи може мені хтось допомогти з наступним: Просте пояснення того, як працює NCE (мені було сказано, що важко розібратися та зрозуміти, тому щось інтуїтивне, що призводить до математики, представленої там, було б чудово) Після пункту …

1
Папір: Яка різниця між нормалізацією шару, Нормалізацією періодичної партії (2016) та Нормалізованою партією RNN (2015)?
Отже, останнім часом з'явився документ про нормалізацію шару . Є також реалізація цього на Keras. Але я пам’ятаю, існують документи під назвою « Нормалізація періодичної партії» (Cooijmans, 2016) та « Batch Normalized Recurrent Neural Networks» (Laurent, 2015). Яка різниця між цими трьома? Є цей розділ, пов’язаний із роботою, який я …

5
Глибоке навчання проти збільшення градієнта: коли використовувати?
У мене є велика проблема даних з великим набором даних (візьмемо, наприклад, 50 мільйонів рядків і 200 стовпців). Набір даних складається з приблизно 100 числових стовпців та 100 категоричних стовпців та стовпця відповідей, що представляє проблему бінарного класу. Можливість кожної з категоричних стовпців менше 50. Я хочу апріорі знати, чи …

3
У класифікаторі softmax навіщо використовувати функцію exp для нормалізації?
Навіщо використовувати softmax на відміну від стандартної нормалізації? У області коментарів у верхній відповіді на це питання @Kilian Batzner порушив 2 питання, які також мене дуже бентежать. Здається, ніхто не дає пояснень, крім чисельних переваг. У мене з’являються причини використання крос-ентропійної втрати, але як це стосується софтмаксу? Ви сказали, що …

7
Чому дані слід перемішувати для завдань машинного навчання
У завданнях машинного навчання зазвичай перетасовувати дані та нормалізувати їх. Мета нормалізації зрозуміла (для того ж діапазону значень функції). Але, багато потрудившись, я не знайшов жодної цінної причини для перенесення даних. Я читав цю публікацію тут, де обговорювали, коли нам потрібно переміщувати дані, але не очевидно, чому нам слід переміщувати …

2
Що таке основна правда
У контексті машинного навчання я бачив, що термін " Земна правда" вживається дуже багато. Я багато шукав і знайшов таке визначення у Вікіпедії : У машинному навчанні термін "основна істина" означає точність класифікації навчального набору для контрольованих методів навчання. Це використовується в статистичних моделях для доведення або спростування гіпотез досліджень. …

1
Чому xgboost так швидше, ніж sklearn GradientBoostingClassifier?
Я намагаюся підготувати градієнтну модель для збільшення градієнта на 50 к. Прикладах із 100 числовими функціями. XGBClassifierобробляє 500 дерев протягом 43 секунд на моїй машині, тоді як GradientBoostingClassifierобробляє лише 10 дерев (!) за 1 хвилину і 2 секунди :( Я не намагався виростити 500 дерев, як це займе години. Я …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

3
Вибір між процесором та графічним процесором для навчання нейронної мережі
Я бачив дискусії з приводу "накладних витрат" GPU, і що для "малих" мереж тренування на процесорі (або мережі процесорів) може бути швидше, ніж на графічному процесорі. Що означає «малий»? Наприклад, чи буде одношаровий MLP зі 100 прихованими одиницями "малим"? Чи змінюється наше визначення "малої" для періодичних архітектур? Чи є якісь …

7
Чи є безкоштовні хмарні сервіси для навчання моделей машинного навчання?
Я хочу навчити глибоку модель з великою кількістю даних про тренування, але мій робочий стіл не має такої сили для підготовки такої глибокої моделі з цими рясними даними. Мені хотілося б знати, чи існують безкоштовні хмарні сервіси, які можна використовувати для моделей машинного навчання та глибокого навчання? Я також хотів …

1
PyTorch проти Tensorflow Fold
І PyTorch, і Tensorflow Fold є глибокими рамками навчання, призначеними для вирішення ситуацій, коли вхідні дані мають неоднакову довжину або розміри (тобто ситуації, коли динамічні графіки є корисними або потрібними). Мені хотілося б знати, як вони порівнюються, у сенсі парадигм, на які вони покладаються (наприклад, динамічне формування) та їх наслідків, …

1
Як Керас обчислює точність?
Як Керас обчислює точність з імовірностей класів? Скажімо, у тестовому наборі у нас є 100 зразків, які можуть належати до одного з двох класів. У нас також є список класових імовірностей. Який поріг використовує Керас, щоб призначити вибірку будь-якому з двох класів?

7
Чи може машинне навчання засвоїти таку функцію, як пошук максимуму зі списку?
У мене є вхід, який є списком, а вихід - максимум елементів вхідного списку. Чи може машинне навчання засвоїти таку функцію, яка завжди вибирає максимум вхідних елементів, наявних у вході? Це може здатися досить базовим питанням, але це може дати мені розуміння того, що може зробити машинне навчання взагалі. Спасибі!

2
Об’єднання двох різних моделей у Keras
Я намагаюся об'єднати дві моделі Кераса в одну модель, і я не в змозі цього досягти. Наприклад, на малюнку, що додається, я хотів би отримати середній шар розміру 8 і використовувати це як вхід до шару (знову ж розмірності 8) в моделі а потім поєднати як модель і модель як …

5
Як встановити кількість нейронів та шарів у нейронних мережах
Я початківець з нейронних мереж і зіткнувся з проблемами в освоєнні двох понять: Як можна визначити кількість середніх шарів даної нейронної мережі? 1 проти 10 чи що завгодно. Як можна вирішити кількість нейронів у кожному середньому шарі? Чи рекомендується мати однакову кількість нейронів у кожному середньому шарі чи це змінюється …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.