Статистика та великі дані machine-learning

1

Як CNN уникає зникаючої градієнтної проблеми

Я багато читав про нейромережі, що розвиваються, і цікавився, як вони уникають проблеми градієнта, що зникає. Я знаю, що мережі глибокої віри складають однорівневі автокодери або інші заздалегідь підготовлені неглибокі мережі, і таким чином можна уникнути цієї проблеми, але я не знаю, як цього уникнути в CNN. За даними Вікіпедії …

15 machine-learning optimization deep-learning gradient-descent

4

Скільки даних вам потрібно для звивистої нейронної мережі?

Якщо у мене є конволюційна нейронна мережа (CNN), яка має близько 1 000 000 параметрів, скільки тренувальних даних потрібно (припустимо, я роблю стохастичний градієнтний спуск)? Чи є якесь правило? Додаткові зауваження: Коли я виконував стохастичний градієнтний спуск (наприклад, 64 патчів за 1 ітерацію), після ~ 10000 ітерацій точність класифікатора може …

15 machine-learning neural-networks deep-learning conv-neural-network

4

Значення прихованих ознак?

Я намагаюся зрозуміти моделі матричної факторизації для систем рекомендування, і я завжди читаю "приховані функції", але що це означає? Я знаю, що означає функція для навчального набору даних, але я не в змозі зрозуміти ідею прихованих особливостей. Кожен стаття на тему, яку я можу знайти, є занадто дрібною. Редагувати: якщо …

15 machine-learning data-mining recommender-system

3

Регуляризація та масштабування функцій в онлайн-навчанні?

Скажімо, у мене є класифікатор логістичної регресії. У звичайному серійному навчанні я мав би термін регуляризатора, щоб запобігти надягання і зберегти ваги невеликими. Я б також нормалізував і масштабував свої функції. У режимі онлайн-навчання я отримую безперервний потік даних. Я оновлюю градієнтне зменшення з кожним прикладом, а потім відкидаю його. …

15 machine-learning normalization regularization online

3

Як вибрати метрику помилок при оцінці класифікатора?

Я бачив різні показники помилок, що використовуються в змаганнях Kaggle: середньоквадратичний, середній-квадратний, AUC серед інших. Яке загальне правило щодо вибору метрики помилок, тобто як ви можете знати, який показник помилки використовувати для даної проблеми? Чи є вказівки?

15 machine-learning classification error

4

Переваги кривих ROC

Які переваги кривих ROC? Наприклад, я класифікую деякі зображення, що є проблемою бінарної класифікації. Я вилучив близько 500 функцій і застосував алгоритм вибору функцій для вибору набору функцій, потім застосував SVM для класифікації. Як у цьому випадку я можу отримати криву ROC? Чи слід змінювати порогові значення мого алгоритму вибору …

15 machine-learning roc

7

Який алгоритм машинного навчання можна використовувати для прогнозування фондового ринку?

Як варіант, передбачити валютні ринки. Я знаю, що це може стати досить складним, тому в якості вступу я шукаю простий алгоритм прогнозування, який має певну точність. (Це для магістерського університетського проекту, який триває чотири місяці) Я читав, що багатошарова нейронна мережа може бути корисною. Будь-які думки з цього приводу? Крім …

15 machine-learning finance

5

Який алгоритм статистичної класифікації може передбачити істинне / хибне для послідовності входів?

З огляду на послідовність входів, мені потрібно визначити, чи має ця послідовність певне бажане властивість. Властивість може бути лише істинною або хибною, тобто є лише два можливі класи, до яких може належати послідовність. Точний взаємозв'язок між послідовністю та властивістю незрозумілий, але я вважаю, що це дуже послідовно і має піддаватися …

15 machine-learning classification modeling

1

Чому жоден ReLU не може вивчити RELU?

У процесі моєї нейронної мережі навіть не можна вивчити евклідову відстань, я ще більше спростив і спробував навчити один РеЛУ (з випадковою вагою) до одного РеЛУ. Це найпростіша мережа, яка є, і все ж половину часу вона не зможе конвергуватися. Якщо початкова здогадка має таку саму орієнтацію, що і ціль, …

15 machine-learning neural-networks optimization keras

3

Яке максимальне значення розбіжності Kullback-Leibler (KL)

Я буду використовувати розбіжність KL в коді python, і я отримав цей підручник . У цьому підручнику реалізувати розбіжність KL досить просто. kl = (model * np.log(model/actual)).sum() Як я розумію, розподіл ймовірностей modelі actualповинен бути <= 1. Моє запитання, яке максимальне обмежене / максимально можливе значення k ?. Мені потрібно …

15 machine-learning distance kullback-leibler

3

Методи вирішення проблеми відсутності даних у машинному навчанні

Практично будь-яка база даних, яку ми хочемо передбачити, використовуючи алгоритми машинного навчання, знайде відсутні значення для деяких характеристик. Існує кілька підходів для вирішення цієї проблеми, щоб виключити рядки, у яких відсутні значення, поки вони не заповняться середніми значеннями характеристик. Я хотів би скористатися дещо більш надійним підходом, який би в …

15 machine-learning scikit-learn data-imputation

2

Що таке помилка Байєса в машинному навчанні?

http://www.deeplearningbook.org/contents/ml.html Сторінка 116 пояснює помилку Байєса, як показано нижче Ідеальна модель - це оракул, який просто знає справжній розподіл ймовірностей, який генерує дані. Навіть така модель все-таки матиме певну помилку у багатьох проблемах, оскільки все ще може бути якийсь шум у розподілі. У випадку керованого навчання відображення від x до …

15 machine-learning deep-learning terminology

2

Що таке "базова лінія" в кривій точності відкликання

Я намагаюся зрозуміти криву точності відкликання, я розумію, що таке точність і відкликання, але те, що я не розумію, це "базове" значення. Я читав це посилання https://classeval.wordpress.com/introduction/introduction-to-the-precision-recall-plot/ і я не розумію базову частину, як показано в "Кривій точності нагадування ідеального класифікатора", що це робить? і як це ми обчислимо? Це …

15 r machine-learning classification precision-recall

2

Як оновлюються ваги в методі пакетного навчання в нейронних мережах?

Може хтось скажіть, будь ласка, як я повинен будувати нейронну мережу за допомогою пакетного методу? Я читав, що в пакетному режимі для всіх зразків навчального набору ми обчислюємо помилку, дельту і, таким чином, дельта ваги для кожного нейрона в мережі, а потім замість негайного оновлення ваг ми їх накопичуємо, а …

15 machine-learning neural-networks

1

Включення умов взаємодії у випадковій лісі

Припустимо, у нас є відповідь Y та предиктори X1, ...., Xn. Якби ми намагалися вписати Y за допомогою лінійної моделі X1, ...., Xn, і просто так сталося, що справжня залежність між Y і X1, ..., Xn не була лінійною, ми могли б бути в змозі щоб виправити модель, трансформуючи X …

15 machine-learning random-forest

Запитання з тегом «machine-learning»