Як мало прикладів тренувань занадто мало при навчанні нейронної мережі?


14

Я початківець, який намагається скласти свій перший проект. Я мав на увазі проект класифікації пісень, але оскільки мене благали вручну, я міг лише розумно зібрати близько 1000 пісень або 60 годин музики.

Я б класифікував декілька класів, тому можливо, що один клас мав би менше 50-100 пісень у навчальному наборі - це здається занадто мало! Чи існує загальне правило про те, скільки даних потрібно для тренування нейронної мережі, щоб дати їй можливість працювати?

Редагувати: Я думав використати ванільний LSTM. Особливості введення матимуть розмір 39, вихідний розмір 6, моя перша спроба прихованого розміру шару буде 100.


2
Це насправді не відповідає, тому що не всі завдання легкі, а різні мережеві архітектури та вибір параметрів гіперпараметрів покращать / шкодять різним моделям по-різному.
Sycorax повідомляє про відновлення Моніки

Як мінімум, вам потрібно вказати структуру вашої мережі та скільки посилань буде для навчання.
gung - Відновити Моніку

Відповіді:


16

Це дійсно залежить від вашого набору даних та мережевої архітектури. Я прочитав (2) одним із головних правил - це кілька тисяч зразків на клас, щоб нейронна мережа почала працювати дуже добре.

На практиці люди намагаються бачити. Не рідко можна знайти дослідження, які показують гідні результати з навчальним набором менше 1000 зразків.


Хороший спосіб орієнтовно оцінити, наскільки може бути корисним більше зразків тренувань - побудувати графік продуктивності нейронної мережі залежно від розміру навчального набору, наприклад з (1):

введіть тут опис зображення


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.