Якщо я правильно розумію визначення точності, точність (% точок даних, класифікованих правильно) є менш кумулятивною, ніж, скажімо, MSE (середня помилка у квадраті). Ось чому ви бачите, що ваш loss
стрімко зростає, а точність коливається.
Інтуїтивно це в основному означає, що деяка частина прикладів класифікується випадковим чином , що створює коливання, оскільки кількість правильних випадкових здогадок завжди коливається (уявіть точність, коли монета завжди повинна повертати "голови"). В основному чутливість до шуму (коли класифікація дає випадковий результат) є загальним визначенням пристосування (див. Вікіпедія):
У статистиці та машинному навчанні одним із найпоширеніших завдань є пристосування «моделі» до набору навчальних даних, щоб мати можливість робити достовірні прогнози щодо загальних непідготовлених даних. У доповненнях статистична модель описує випадкову помилку або шум замість базового співвідношення
Іншим свідченням перевитрати є те, що ваші втрати збільшуються, втрата вимірюється точніше, вона чутливіша до галасливого передбачення, якщо вона не розбита сигмоїдами / порогами (що, здається, є вашим випадком для самої втрати). Інтуїтивно можна уявити ситуацію, коли мережа занадто впевнена у виведенні (коли вона неправильна), тому вона дає значення далеко від порогового випадку у випадку випадкової невідповідності.
Що стосується Вашого випадку, Ваша модель не належним чином зареєстрована, можливі причини:
- недостатньо точок даних, занадто велика ємність
- замовлення
- відсутність / неправильне масштабування / нормалізація функції
- ααα
Можливі рішення:
- отримати більше точок даних (або штучно розширити набір існуючих)
- гра з гіпер-параметрами (наприклад, збільшення / зменшення потужності або термін регуляризації)
- регуляризація : спробуйте випадання, раннє припинення тощо