Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

2
Яке визначення точності Top-n?
Я читаю науковий документ про класифікацію зображень. В експериментальних результатах вони говорять про точність топ-1 і топ-5, але я ніколи не чув про цей термін і не можу знайти його за допомогою google. Чи може хтось дати мені визначення або вказати мені кудись? :)

2
Чому масштаб важливий для лінійної класифікації SVM?
Виконуючи лінійну класифікацію SVM, часто корисно нормалізувати дані тренувань, наприклад, віднімаючи середнє та ділення на стандартне відхилення, а потім масштабувати дані тесту із середнім та стандартним відхиленням даних тренувань. Чому цей процес різко змінює ефективність класифікації?

1
Що таке часова класифікація коннекціоністів (CTC)?
Я хочу зробити проект оптичного розпізнавання символів (OCR). Після деяких досліджень я натрапив на архітектуру, яка здається цікавою: CNN + RNN + CTC. Мені знайомі стислі нейронні мережі (CNN) та періодичні нейронні мережі (RNN), але що таке часова класифікація коннекціоністів (CTC)? Мені б хотілося пояснення в умовах непростої людини.

1
Чому важливо включити термін корекції зміщення для оптимізатора Адама для глибокого навчання?
Я читав про оптимізатора Адама для глибокого навчання і натрапив на таке речення у новій книзі « Глибоке навчання » Беґніо, Гудфллоу та Кортвіла: Адам включає коригування зміщення оцінок як моментів першого порядку (термін імпульсу), так і (безцентрованих) моментів другого порядку для обліку їх ініціалізації при початку. видається, що основною …

1
Що означає розмір VC про глибоке навчання?
У базовому машинному навчанні нас навчають наступним "правилам": a) розмір ваших даних повинен бути щонайменше в 10 разів більший за розмір VC вашого набору гіпотез. б) нейронна мережа з N з'єднаннями має розмір VC приблизно N. Отже, коли нейрональна мережа глибокого навчання має, скажімо, мільйони одиниць, чи це означає, що …

1
Яка «ємність» моделі машинного навчання?
Я вивчаю цей Навчальний посібник з різних автоінкодерів Карла Доерша . На другій сторінці зазначено: Однією з найпопулярніших таких фреймворків є Variational Autoencoder [1, 3], тема цього підручника. Припущення цієї моделі слабкі, і навчання проходить швидко за допомогою зворотного розповсюдження. VAE роблять наближення, але помилка, введена цим наближенням, мабуть, невелика …

2
Максимальна середня розбіжність (розподіл відстані)
У мене є два набори даних (вихідні та цільові дані), які слідують за різним розподілом. Я використовую MMD - це непараметричний розподіл відстані - для обчислення граничного розподілу між вихідними та цільовими даними. вихідні дані, Xs цільові дані, Xt адаптаційна матриця A * Прогнозовані дані, Zs = A '* Xs …

1
Чому ми не використовуємо непостійні показники навчання для гідного градієнта для речей, відмінних від нейронних мереж?
Література поглибленого вивчення повна розумних хитрощів із використанням непостійних темпів навчання в градієнтному узвозі. Такі речі, як експоненціальний розпад, RMSprop, Adagrad тощо, легко здійснити і доступні у кожному глибокому навчальному пакеті, проте вони, як видається, не існують поза нейронних мереж. Чи є для цього причина? Якщо люди просто не хвилюються, …

4
Прогностичні моделі: статистика не може перемогти машинне навчання? [зачинено]
Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі, лише відредагувавши цю публікацію . Закрито 2 роки тому . Зараз я переглядаю магістерську програму, зосереджену на статистиці / економетриці. У мого майстра всі …

2
Чи є математичні причини згортання в нейронних мережах поза доцільністю?
У конволюційних нейронних мережах (CNN) матриця ваг на кожному кроці отримує свої рядки та стовпці, перевернуті, щоб отримати матрицю ядра, перш ніж приступити до згортання. Про це пояснюється у серії відео Уго Ларошель тут : Обчислення прихованих карт буде відповідати виконанню дискретної згортки з каналом з попереднього шару, використовуючи матрицю …

1
Зустрічаються два світи: використання МЛ для складних даних опитування
Мене вражає, здавалося б, проста проблема, але я вже кілька тижнів не знайшов підходящого рішення. У мене є досить багато даних опитування / опитування (десятки тисяч респондентів, скажімо, 50 тис. На набір даних), що випливає з чогось, на що я сподіваюся, називається складно розробленим опитуванням з вагою, стратифікацією, специфічною маршрутизацією …

2
З огляду на дві лінійні регресійні моделі, яка модель буде краще?
Я взяв курс машинного навчання в коледжі. В одній із цитат було задано це питання. Модель 1: y=θx+ϵy=θx+ϵ y = \theta x + \epsilon Модель 2: y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon Яка з перерахованих моделей краще відповідатиме даним? (припустимо, дані можна моделювати за допомогою лінійної …

3
Сучасний алгоритм навчання ансамблю у завданнях розпізнавання образів?
Структура цього питання полягає в наступному: спочатку я надаю поняття ансамблевого навчання , далі подаю список завдань розпізнавання шаблонів , потім наводжу приклади алгоритмів навчання ансамблю та, нарешті, ввожу своє запитання. Ті, кому не потрібна вся додаткова інформація, можуть просто подивитися на заголовки і перейти безпосередньо до мого питання. Що …

2
Орієнтовні показники для MCMC
Чи проводилися широкомасштабні дослідження методів MCMC, які порівнюють продуктивність декількох різних алгоритмів набір тестової щільності? Я маю на увазі щось еквівалентне документу Ріоса та Сахінідіса (2013), який є ретельним порівнянням великої кількості оптимізаторів чорних коробок без похідних у кількох класах тестових функцій. Для MCMC ефективність може бути оцінена, наприклад, в …

2
Що таке мінімізація енергії в машинному навчанні?
Я читав про оптимізацію недоброзичливої ​​проблеми в комп’ютерному зорі і натрапив на пояснення нижче щодо оптимізації у Вікіпедії. Я не розумію, чому вони називають цю оптимізацію " мінімізацією енергії " в "Комп'ютерному баченні"? Проблема оптимізації може бути представлена ​​наступним чином: Дано: функція від деякого набору A до реальних чиселf:A→Rf:A→Rf: A …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.