Запитання з тегом «deep-learning»

Область машинного навчання, пов'язана з вивченням ієрархічних уявлень даних, в основному з глибокими нейронними мережами.

1
Що таке часова класифікація коннекціоністів (CTC)?
Я хочу зробити проект оптичного розпізнавання символів (OCR). Після деяких досліджень я натрапив на архітектуру, яка здається цікавою: CNN + RNN + CTC. Мені знайомі стислі нейронні мережі (CNN) та періодичні нейронні мережі (RNN), але що таке часова класифікація коннекціоністів (CTC)? Мені б хотілося пояснення в умовах непростої людини.

1
Що означає розмір VC про глибоке навчання?
У базовому машинному навчанні нас навчають наступним "правилам": a) розмір ваших даних повинен бути щонайменше в 10 разів більший за розмір VC вашого набору гіпотез. б) нейронна мережа з N з'єднаннями має розмір VC приблизно N. Отже, коли нейрональна мережа глибокого навчання має, скажімо, мільйони одиниць, чи це означає, що …

1
Яка «ємність» моделі машинного навчання?
Я вивчаю цей Навчальний посібник з різних автоінкодерів Карла Доерша . На другій сторінці зазначено: Однією з найпопулярніших таких фреймворків є Variational Autoencoder [1, 3], тема цього підручника. Припущення цієї моделі слабкі, і навчання проходить швидко за допомогою зворотного розповсюдження. VAE роблять наближення, але помилка, введена цим наближенням, мабуть, невелика …

1
Чому ми не використовуємо непостійні показники навчання для гідного градієнта для речей, відмінних від нейронних мереж?
Література поглибленого вивчення повна розумних хитрощів із використанням непостійних темпів навчання в градієнтному узвозі. Такі речі, як експоненціальний розпад, RMSprop, Adagrad тощо, легко здійснити і доступні у кожному глибокому навчальному пакеті, проте вони, як видається, не існують поза нейронних мереж. Чи є для цього причина? Якщо люди просто не хвилюються, …

3
Глибокі нейронні мережі - тільки для класифікації зображень?
Усі приклади, які я знайшов, використовуючи глибокі переконання або звивисті нейронні мережі, використовують їх для класифікації зображень, виявлення символів або розпізнавання мови. Чи корисні глибокі нейронні мережі також корисні для класичних завдань регресії, де функції не структуровані (наприклад, не розташовані в послідовності чи сітці)? Якщо так, чи можете ви навести …

1
Чи є якась різниця між тренуванням штабельного автокодера та двошарової нейронної мережі?
Скажімо, я пишу алгоритм для побудови двошарових складених автокодер та двошарової нейронної мережі. Вони однакові речі чи різниця? Що я розумію, це те, що коли я будую складений автокодер, я буду будувати пошарово. Для нейронної мережі я би ініціалізував усі параметри в мережі, а потім для кожної точки даних я …

2
Як реалізується просторовий викид у 2D?
Це стосується статті " Ефективна локалізація об'єктів за допомогою згорткових мереж" , і з того, що я розумію, випадання реалізується в 2D. Після прочитання коду від Кераса про те, як реалізовано просторовий 2D випадання, в основному реалізується випадкова бінарна маска форми [batch_size, 1, 1, num_channels]. Однак що саме робить цей …

3
Чому нейронні мережі потребують вибору / інженерії функцій?
Особливо в контексті змагань з караглів я помітив, що продуктивність моделі - це все, що стосується вибору / інженерії функцій. Хоча я цілком можу зрозуміти, чому це стосується тих випадків, коли ми маємо справу з більш звичайними / старошкільними алгоритмами ML, я не розумію, чому це було б у випадку …

2
Як дресирується шар вбудовування в шар Keras Embedding
Як навчається шар вбудовування в шар вбудовування Keras? (скажімо, використовуючи заголовок tensorflow, тобто це схоже на word2vec, рукавичку або швидкий текст) Припустимо, ми не використовуємо перевірене вбудовування.

4
Нейронна мережа для множинної регресії на виході
У мене є набір даних, що містить 34 колонки введення та 8 вихідних стовпців. Один із способів вирішити проблему - взяти 34 входи та побудувати індивідуальну модель регресії для кожного вихідного стовпчика. Мені цікаво, чи можна вирішити цю проблему, використовуючи лише одну модель, особливо за допомогою нейронної мережі. Я використовував …

2
Що таке байєсівське глибоке навчання?
Що таке байєсівське глибоке навчання і як воно пов'язане з традиційною баєсійською статистикою та традиційним глибоким навчанням? Які основні поняття та математика задіяні? Чи можу я сказати, що це просто не параметрична байесівська статистика? Які його семінарські роботи, а також сучасні основні розробки та застосування? PS: Байєсівське глибоке навчання привертає …

1
Чому навчання з глибокого підкріплення нестабільне?
У статті DeepMind за 2015 рік про глибоке підкріплення навчання йдеться про те, що "попередні спроби поєднати RL з нейронними мережами значною мірою зазнали невдачі через нестабільне навчання". Потім у статті перераховані деякі причини цього на основі співвідношень спостережень. Скажіть, будь ласка, хтось пояснить, що це означає? Це форма надмірного …

2
Чому нейронні мережі легко обдурити?
Я прочитав кілька статей про створення вручну зображень, щоб "обдурити" нейронну мережу (див. Нижче). Це тому, що мережі лише моделюють умовну ймовірність ? Якщо мережа може моделювати спільну ймовірність p ( y , x ) , чи все ж такі випадки будуть мати місце?p(y|x)p(y|x)p(y|x)p(y,x)p(y,x)p(y,x) Я здогадуюсь, що такі штучно створені …

1
Що означає "від кінця до кінця" у методах глибокого навчання?
Я хочу знати, що це таке, і чим він відрізняється від складання? Припустимо, я хочу досягти високої точності в класифікації та сегментації, для конкретного завдання, якщо для досягнення цього я використовую різні мережі, такі як CNN, RNN тощо, це називається цільовою моделлю? (архітектура?) чи ні?

1
Які корисні методи збільшення даних для глибоких згорткових нейронних мереж?
Передумови: Я нещодавно на більш глибокому рівні зрозумів важливість розширення даних під час тренування конволюційних нейронних мереж після того, як побачив цю чудову розмову Джеффрі Хінтона . Він пояснює, що конволюційні нейронні мережі сучасного покоління не здатні узагальнити систему відліку обстежуваного об'єкта, що ускладнює мережу по-справжньому зрозуміти, що дзеркальні зображення …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.