Статистика та великі дані machine-learning

2

Я читаю науковий документ про класифікацію зображень. В експериментальних результатах вони говорять про точність топ-1 і топ-5, але я ніколи не чув про цей термін і не можу знайти його за допомогою google. Чи може хтось дати мені визначення або вказати мені кудись? :)

15 machine-learning

2

Чому масштаб важливий для лінійної класифікації SVM?

Виконуючи лінійну класифікацію SVM, часто корисно нормалізувати дані тренувань, наприклад, віднімаючи середнє та ділення на стандартне відхилення, а потім масштабувати дані тесту із середнім та стандартним відхиленням даних тренувань. Чому цей процес різко змінює ефективність класифікації?

15 machine-learning svm standardization

1

Що таке часова класифікація коннекціоністів (CTC)?

Я хочу зробити проект оптичного розпізнавання символів (OCR). Після деяких досліджень я натрапив на архітектуру, яка здається цікавою: CNN + RNN + CTC. Мені знайомі стислі нейронні мережі (CNN) та періодичні нейронні мережі (RNN), але що таке часова класифікація коннекціоністів (CTC)? Мені б хотілося пояснення в умовах непростої людини.

15 machine-learning deep-learning conv-neural-network rnn

1

Чому важливо включити термін корекції зміщення для оптимізатора Адама для глибокого навчання?

Я читав про оптимізатора Адама для глибокого навчання і натрапив на таке речення у новій книзі « Глибоке навчання » Беґніо, Гудфллоу та Кортвіла: Адам включає коригування зміщення оцінок як моментів першого порядку (термін імпульсу), так і (безцентрованих) моментів другого порядку для обліку їх ініціалізації при початку. видається, що основною …

15 machine-learning neural-networks optimization conv-neural-network adam

1

Що означає розмір VC про глибоке навчання?

У базовому машинному навчанні нас навчають наступним "правилам": a) розмір ваших даних повинен бути щонайменше в 10 разів більший за розмір VC вашого набору гіпотез. б) нейронна мережа з N з'єднаннями має розмір VC приблизно N. Отже, коли нейрональна мережа глибокого навчання має, скажімо, мільйони одиниць, чи це означає, що …

15 machine-learning neural-networks deep-learning vc-dimension

1

Яка «ємність» моделі машинного навчання?

Я вивчаю цей Навчальний посібник з різних автоінкодерів Карла Доерша . На другій сторінці зазначено: Однією з найпопулярніших таких фреймворків є Variational Autoencoder [1, 3], тема цього підручника. Припущення цієї моделі слабкі, і навчання проходить швидко за допомогою зворотного розповсюдження. VAE роблять наближення, але помилка, введена цим наближенням, мабуть, невелика …

15 machine-learning deep-learning autoencoders variational-bayes

2

Максимальна середня розбіжність (розподіл відстані)

У мене є два набори даних (вихідні та цільові дані), які слідують за різним розподілом. Я використовую MMD - це непараметричний розподіл відстані - для обчислення граничного розподілу між вихідними та цільовими даними. вихідні дані, Xs цільові дані, Xt адаптаційна матриця A * Прогнозовані дані, Zs = A '* Xs …

15 machine-learning distributions distance feature-construction domain-adaptation

1

Чому ми не використовуємо непостійні показники навчання для гідного градієнта для речей, відмінних від нейронних мереж?

Література поглибленого вивчення повна розумних хитрощів із використанням непостійних темпів навчання в градієнтному узвозі. Такі речі, як експоненціальний розпад, RMSprop, Adagrad тощо, легко здійснити і доступні у кожному глибокому навчальному пакеті, проте вони, як видається, не існують поза нейронних мереж. Чи є для цього причина? Якщо люди просто не хвилюються, …

14 machine-learning deep-learning optimization gradient-descent

4

Прогностичні моделі: статистика не може перемогти машинне навчання? [зачинено]

Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі, лише відредагувавши цю публікацію . Закрито 2 роки тому . Зараз я переглядаю магістерську програму, зосереджену на статистиці / економетриці. У мого майстра всі …

14 machine-learning forecasting predictive-models prediction out-of-sample

2

Чи є математичні причини згортання в нейронних мережах поза доцільністю?

У конволюційних нейронних мережах (CNN) матриця ваг на кожному кроці отримує свої рядки та стовпці, перевернуті, щоб отримати матрицю ядра, перш ніж приступити до згортання. Про це пояснюється у серії відео Уго Ларошель тут : Обчислення прихованих карт буде відповідати виконанню дискретної згортки з каналом з попереднього шару, використовуючи матрицю …

14 machine-learning neural-networks conv-neural-network convolution

1

Зустрічаються два світи: використання МЛ для складних даних опитування

Мене вражає, здавалося б, проста проблема, але я вже кілька тижнів не знайшов підходящого рішення. У мене є досить багато даних опитування / опитування (десятки тисяч респондентів, скажімо, 50 тис. На набір даних), що випливає з чогось, на що я сподіваюся, називається складно розробленим опитуванням з вагою, стратифікацією, специфічною маршрутизацією …

14 machine-learning survey-weights survey-sampling

2

З огляду на дві лінійні регресійні моделі, яка модель буде краще?

Я взяв курс машинного навчання в коледжі. В одній із цитат було задано це питання. Модель 1: y=θx+ϵy=θx+ϵ y = \theta x + \epsilon Модель 2: y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon Яка з перерахованих моделей краще відповідатиме даним? (припустимо, дані можна моделювати за допомогою лінійної …

14 regression machine-learning self-study modeling model

3

Сучасний алгоритм навчання ансамблю у завданнях розпізнавання образів?

Структура цього питання полягає в наступному: спочатку я надаю поняття ансамблевого навчання , далі подаю список завдань розпізнавання шаблонів , потім наводжу приклади алгоритмів навчання ансамблю та, нарешті, ввожу своє запитання. Ті, кому не потрібна вся додаткова інформація, можуть просто подивитися на заголовки і перейти безпосередньо до мого питання. Що …

14 machine-learning neural-networks pattern-recognition ensemble ocr

2

Орієнтовні показники для MCMC

Чи проводилися широкомасштабні дослідження методів MCMC, які порівнюють продуктивність декількох різних алгоритмів набір тестової щільності? Я маю на увазі щось еквівалентне документу Ріоса та Сахінідіса (2013), який є ретельним порівнянням великої кількості оптимізаторів чорних коробок без похідних у кількох класах тестових функцій. Для MCMC ефективність може бути оцінена, наприклад, в …

14 machine-learning bayesian references mcmc

2

Що таке мінімізація енергії в машинному навчанні?

Я читав про оптимізацію недоброзичливої проблеми в комп’ютерному зорі і натрапив на пояснення нижче щодо оптимізації у Вікіпедії. Я не розумію, чому вони називають цю оптимізацію " мінімізацією енергії " в "Комп'ютерному баченні"? Проблема оптимізації може бути представлена наступним чином: Дано: функція від деякого набору A до реальних чиселf:A→Rf:A→Rf: A …

14 machine-learning optimization computer-vision

Запитання з тегом «machine-learning»