Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

1
Як CNN уникає зникаючої градієнтної проблеми
Я багато читав про нейромережі, що розвиваються, і цікавився, як вони уникають проблеми градієнта, що зникає. Я знаю, що мережі глибокої віри складають однорівневі автокодери або інші заздалегідь підготовлені неглибокі мережі, і таким чином можна уникнути цієї проблеми, але я не знаю, як цього уникнути в CNN. За даними Вікіпедії …

4
Скільки даних вам потрібно для звивистої нейронної мережі?
Якщо у мене є конволюційна нейронна мережа (CNN), яка має близько 1 000 000 параметрів, скільки тренувальних даних потрібно (припустимо, я роблю стохастичний градієнтний спуск)? Чи є якесь правило? Додаткові зауваження: Коли я виконував стохастичний градієнтний спуск (наприклад, 64 патчів за 1 ітерацію), після ~ 10000 ітерацій точність класифікатора може …

4
Значення прихованих ознак?
Я намагаюся зрозуміти моделі матричної факторизації для систем рекомендування, і я завжди читаю "приховані функції", але що це означає? Я знаю, що означає функція для навчального набору даних, але я не в змозі зрозуміти ідею прихованих особливостей. Кожен стаття на тему, яку я можу знайти, є занадто дрібною. Редагувати: якщо …

3
Регуляризація та масштабування функцій в онлайн-навчанні?
Скажімо, у мене є класифікатор логістичної регресії. У звичайному серійному навчанні я мав би термін регуляризатора, щоб запобігти надягання і зберегти ваги невеликими. Я б також нормалізував і масштабував свої функції. У режимі онлайн-навчання я отримую безперервний потік даних. Я оновлюю градієнтне зменшення з кожним прикладом, а потім відкидаю його. …

3
Як вибрати метрику помилок при оцінці класифікатора?
Я бачив різні показники помилок, що використовуються в змаганнях Kaggle: середньоквадратичний, середній-квадратний, AUC серед інших. Яке загальне правило щодо вибору метрики помилок, тобто як ви можете знати, який показник помилки використовувати для даної проблеми? Чи є вказівки?

4
Переваги кривих ROC
Які переваги кривих ROC? Наприклад, я класифікую деякі зображення, що є проблемою бінарної класифікації. Я вилучив близько 500 функцій і застосував алгоритм вибору функцій для вибору набору функцій, потім застосував SVM для класифікації. Як у цьому випадку я можу отримати криву ROC? Чи слід змінювати порогові значення мого алгоритму вибору …

7
Який алгоритм машинного навчання можна використовувати для прогнозування фондового ринку?
Як варіант, передбачити валютні ринки. Я знаю, що це може стати досить складним, тому в якості вступу я шукаю простий алгоритм прогнозування, який має певну точність. (Це для магістерського університетського проекту, який триває чотири місяці) Я читав, що багатошарова нейронна мережа може бути корисною. Будь-які думки з цього приводу? Крім …

5
Який алгоритм статистичної класифікації може передбачити істинне / хибне для послідовності входів?
З огляду на послідовність входів, мені потрібно визначити, чи має ця послідовність певне бажане властивість. Властивість може бути лише істинною або хибною, тобто є лише два можливі класи, до яких може належати послідовність. Точний взаємозв'язок між послідовністю та властивістю незрозумілий, але я вважаю, що це дуже послідовно і має піддаватися …

1
Чому жоден ReLU не може вивчити RELU?
У процесі моєї нейронної мережі навіть не можна вивчити евклідову відстань, я ще більше спростив і спробував навчити один РеЛУ (з випадковою вагою) до одного РеЛУ. Це найпростіша мережа, яка є, і все ж половину часу вона не зможе конвергуватися. Якщо початкова здогадка має таку саму орієнтацію, що і ціль, …

3
Яке максимальне значення розбіжності Kullback-Leibler (KL)
Я буду використовувати розбіжність KL в коді python, і я отримав цей підручник . У цьому підручнику реалізувати розбіжність KL досить просто. kl = (model * np.log(model/actual)).sum() Як я розумію, розподіл ймовірностей modelі actualповинен бути <= 1. Моє запитання, яке максимальне обмежене / максимально можливе значення k ?. Мені потрібно …

3
Методи вирішення проблеми відсутності даних у машинному навчанні
Практично будь-яка база даних, яку ми хочемо передбачити, використовуючи алгоритми машинного навчання, знайде відсутні значення для деяких характеристик. Існує кілька підходів для вирішення цієї проблеми, щоб виключити рядки, у яких відсутні значення, поки вони не заповняться середніми значеннями характеристик. Я хотів би скористатися дещо більш надійним підходом, який би в …

2
Що таке помилка Байєса в машинному навчанні?
http://www.deeplearningbook.org/contents/ml.html Сторінка 116 пояснює помилку Байєса, як показано нижче Ідеальна модель - це оракул, який просто знає справжній розподіл ймовірностей, який генерує дані. Навіть така модель все-таки матиме певну помилку у багатьох проблемах, оскільки все ще може бути якийсь шум у розподілі. У випадку керованого навчання відображення від x до …

2
Що таке "базова лінія" в кривій точності відкликання
Я намагаюся зрозуміти криву точності відкликання, я розумію, що таке точність і відкликання, але те, що я не розумію, це "базове" значення. Я читав це посилання https://classeval.wordpress.com/introduction/introduction-to-the-precision-recall-plot/ і я не розумію базову частину, як показано в "Кривій точності нагадування ідеального класифікатора", що це робить? і як це ми обчислимо? Це …

2
Як оновлюються ваги в методі пакетного навчання в нейронних мережах?
Може хтось скажіть, будь ласка, як я повинен будувати нейронну мережу за допомогою пакетного методу? Я читав, що в пакетному режимі для всіх зразків навчального набору ми обчислюємо помилку, дельту і, таким чином, дельта ваги для кожного нейрона в мережі, а потім замість негайного оновлення ваг ми їх накопичуємо, а …

1
Включення умов взаємодії у випадковій лісі
Припустимо, у нас є відповідь Y та предиктори X1, ...., Xn. Якби ми намагалися вписати Y за допомогою лінійної моделі X1, ...., Xn, і просто так сталося, що справжня залежність між Y і X1, ..., Xn не була лінійною, ми могли б бути в змозі щоб виправити модель, трансформуючи X …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.