Те, як я на це дивлюсь, полягає в тому, що статистика / машинне навчання говорить вам про те, що вам слід оптимізувати, а оптимізація - як ви це робите.
Y=Xβ+εE(ε)=0Var(ε)=σ2Iβ^
β^=argminb∈Rp||Y−Xb||2.
β^
f^=argminf∈F1n∑i=1nL(yi,f(xi))
Ff^
Щоб відповісти на ваше точне запитання, знаючи оптимізацію, безумовно, корисно, але, як правило, ніхто не є експертом у всіх цих областях, тому ви дізнаєтесь стільки, скільки зможете, але деякі аспекти завжди будуть для вас чимось чорним. Можливо, ви неправильно не вивчили результати SLT за вашим улюбленим алгоритмом ML, або, можливо, ви не знаєте внутрішньої роботи оптимізатора, який ви використовуєте. Це подорож протягом усього життя.