Щоб додати відповідь Тьєррі, ви можете думати про помилку як функцію вагового вектора, тобто як функцію від Rн→ Rяку ви хочете мінімізувати. Алгоритм зворотного розповсюдження працює, переглядаючи локальну околицю точки і бачивши, який напрямок призведе до меншої помилки. Це дасть вам місцевий мінімум.
Те, що ви хочете, це глобальний мінімум, але у вас немає гарантованого способу його пошуку. А якщо на вашій поверхні є кілька локальних мінімумів, то ви можете потрапити в біду.
Але якщо його є лише кілька, то стратегія Тьєррі повинна працювати - виконання декількох пошуків локальних мінімумів, починаючи з випадково вибраних точок, повинно збільшити шанси на пошук глобального мінімуму.
І в тому щасливому випадку, в якому є лише один мінімум - будь-який початковий вектор ваги приведе вас до цього.