Аутсайдер у галузі ML / DL; розпочав курс глибокого навчання Udacity, який базується на Tensorflow; виконання завдання 3 завдання 4; намагаючись налаштувати рівень навчання за допомогою наступної конфігурації:
- Розмір партії 128
- Кількість кроків: достатньо, щоб заповнити 2 епохи
- Розміри прихованих шарів: 1024, 305, 75
- Ініціалізація ваги: усічений нормальний з std. відхилення sqrt (2 / n), де n - розмір попереднього шару
- Ймовірність збереження випаду: 0,75
- Регуляризація: не застосовується
- Алгоритм швидкості навчання: експоненціальний розпад
пограти з параметрами швидкості навчання; вони, здається, не мають ефекту в більшості випадків; код тут ; результати:
Accuracy learning_rate decay_steps decay_rate staircase
93.7 .1 3000 .96 True
94.0 .3 3000 .86 False
94.0 .3 3000 .96 False
94.0 .3 3000 .96 True
94.0 .5 3000 .96 True
- Як я повинен систематично налаштовувати рівень навчання?
- Як швидкість навчання пов'язана з кількістю кроків?