Відповіді:
Формально одного прихованого шару достатньо для наближення безперервної функції до будь-якої бажаної міри точності, тому в цьому сенсі вам ніколи не потрібно більше 1. Це називається теоремою загального наближення .
Пошук найкращої топології для даної проблеми є проблемою відкритого дослідження. Наскільки я знаю, для цього існує мало універсальних «великих принципів».
Для даної проблеми одним із варіантів є застосування нейроеволюційного підходу, такого як NEAT , який намагається знайти топологію, яка добре працює для проблеми.