Мені було цікаво, чому так важливо принципове / теоретичне машинне навчання? З особистої точки зору як людини я можу зрозуміти, чому принципове машинне навчання було б важливим:
- людям подобається розуміти, що вони роблять, ми знаходимо красу і задоволення для розуміння.
- з теоретичної точки зору, математика - це весело
- коли існують принципи, які керують дизайном речей, менше часу витрачається на випадкові здогадки, дивні спроби та помилки. Якби ми зрозуміли, скажімо, як насправді працювали нейронні мережі, можливо, ми могли б витратити набагато кращий час на їх розробку, а не на велику кількість спроб та помилок, які зараз виникають.
- з недавніх пір, якщо принципи зрозумілі і теорія також зрозуміла, тоді слід (сподіваємось) більше прозорості для системи. Це добре, тому що якщо ми розуміємо, над якою системою працює, то AI ризикує, що багато людей скажуть майже всьому.
- принципи, здається, є стислим способом узагальнення важливих структур, які світ може мати, і коли використовувати інструмент, а не інший.
Однак чи справді ці причини досить сильні, щоб виправдати інтенсивне теоретичне вивчення машинного навчання? Однією з найбільших критичних теорій є те, що, оскільки це так важко зробити, вони, як правило, вивчають якийсь дуже обмежений випадок або припущення, які повинні бути зроблені по суті, роблять результати марними. Я думаю, що я чув це одного разу на розмові в MIT від творця Tor. Те, що деякі критики Тора, які він чув, є теоретичним аргументом, але, по суті, люди ніколи не можуть довести речі про реальні сценарії реального життя, оскільки вони такі складні.
У цій новій ері з такою кількістю обчислювальної потужності та даних ми можемо протестувати наші моделі за допомогою реальних наборів даних та тестових наборів. Ми можемо побачити, чи все працює, використовуючи емпіризм. Якщо ми зможемо замість цього досягти AGI або систем, які працюють з технікою та емпіризмом, чи все-таки варто дотримуватися принципового та теоретичного обгрунтування машинного навчання, особливо коли кількісні межі настільки важко досягти, але інтуїції та якісні відповіді набагато простіші досягти підходу, керованого даними? Такий підхід був недоступний у класичній статистиці, тому я вважаю, що теорія була настільки важливою у ті часи, тому що математика була єдиним способом, за яким ми могли бути впевнені, що все правильно чи що вони насправді працюють так, як ми думали.
Я особисто завжди любив і думав, що теорія і важливий принциповий підхід. Але, маючи змогу просто випробувати речі з реальними даними та обчислювальною потужністю, змусило мене замислитися, чи не варто все-таки докладати великих зусиль (і потенційно низьких винагород) теоретичних досліджень.
Чи справді таке важливе теоретичне та принципове заняття машинним навчанням?