Як можна визначити оптимальну швидкість навчання для градієнтного спуску? Я думаю, що я міг би автоматично його відрегулювати, якщо функція витрат поверне більше значення, ніж у попередній ітерації (алгоритм не збіжиться), але я не дуже впевнений, яке нове значення воно має прийняти.