Я намагаюся отримати глобальну точку зору на деякі найважливіші ідеї машинного навчання, і мені було цікаво, чи існує комплексне трактування різних понять втрат (квадрат, журнал, шарнір, проксі тощо). Я думав про щось більш чітке, формальне представлення чудового посту Джона Ленгфорда на тему « Семантика функцій втрат» .