Що змусило мене зрозуміти проблему, що стосується переозброєння, - це уявити, якою може бути максимально обробка. По суті, це була б проста таблиця пошуку.
Ви кажете моделі, яка атрибутика має кожен фрагмент даних, і він просто запам'ятовує їх і більше нічого не робить з цим. Якщо ви дасте йому частину даних, яку він бачив раніше, вона перегляне це і просто відрегулює те, що ви сказали раніше. Якщо ви дасте йому дані, яких раніше не бачили, результат непередбачуваний або випадковий. Але сенс машинного навчання не в тому, щоб сказати вам, що сталося, це зрозуміти закономірності та використовувати ці зразки, щоб передбачити, що відбувається.
Тож подумайте про дерево рішень. Якщо ви постійно зростаєте і збільшуєте дерево рішень, врешті-решт, ви закінчите дерево, в якому кожен вузол листя базується саме на одній точці даних. Ви щойно знайшли зворотний спосіб створення таблиці перегляду.
Щоб узагальнити свої результати, щоб з’ясувати, що може статися в майбутньому, ви повинні створити модель, яка узагальнює те, що відбувається у вашому навчальному наборі. Моделі Overfit чудово працюють із описом даних, які у вас уже є, але описові моделі не обов'язково є прогнозними.
Теорема «Без вільного обіду» говорить про те, що жодна модель не може перевершити будь-яку іншу модель на наборі всіх можливих випадків. Якщо ви хочете передбачити, що буде далі в послідовності чисел "2, 4, 16, 32", ви не зможете побудувати модель більш точну, ніж будь-яка інша, якщо ви не зробите припущення, що існує базовий шаблон. Модель, яка переоцінює, насправді не оцінює шаблони - це просто моделювати те, що вона знає, що можливо, і надаючи вам спостереження. Ви отримуєте прогнозовану силу, припускаючи, що є якась основна функція, і якщо ви зможете визначити, що це за функція, ви можете передбачити результат подій. Але якщо дійсно немає шаблону, то вам не пощастить, і все, на що можна сподіватися, - це оглядова таблиця, яка розповість вам, що ви знаєте, що можливо.