Як зазначають коментарі до вашого запитання, багато людей працюють над пошуком чогось кращого. Хоча я хотів би відповісти на це питання, розширивши коментар, залишений @josh
Усі моделі неправильні, але деякі корисні (Wiki)
Вищенаведене твердження є загальною істиною, що використовується для опису природи статистичних моделей. Використовуючи доступні нам дані, ми можемо створити моделі, які дозволять нам робити корисні речі, такі як приблизна прогнозована величина.
Візьмемо для прикладу лінійну регресію
Використовуючи ряд спостережень, ми можемо підходити до моделі, щоб дати нам приблизне значення для залежної змінної з урахуванням будь-якого значення для незалежної змінної.
Бернхем, КП; Anderson, DR (2002), вибір моделі та мультимодель> умовивід: практичний інформаційно-теоретичний підхід (2-е видання):
"Модель є спрощенням або наближенням реальності, а отже, не відображатиме всю реальність ... Коробка зазначила, що" всі моделі помиляються, але деякі корисні ". Хоча модель ніколи не може бути" правдою ", модель може бути класифікованим від дуже корисного, корисного, до дещо корисного, нарешті, по суті марного ».
Відхилення від нашої моделі (як видно на зображенні вище) здаються випадковими, деякі спостереження знаходяться нижче лінії, а деякі - вище, але наша регресія показує загальну кореляцію. Хоча відхилення в нашій моделі виглядають випадковими, в реалістичних сценаріях будуть інші фактори, які викликають це відхилення. Наприклад, уявіть, як спостерігають за автомобілями, коли вони їхали через перехрестя, де вони повинні повернути ліворуч або праворуч, щоб продовжувати, автомобілі повертаються без конкретного малюнка. Хоча ми могли б сказати, що напрямок руху автомобілів є абсолютно випадковим, чи кожен водій досягає перехрестя і в цьому місці приймає випадкове рішення, яким шляхом повернути? Насправді вони, ймовірно, прямують кудись із конкретних причин, і не намагаючись зупинити кожен автомобіль, щоб розпитати їх про їх міркування, ми можемо лише описати їх дії як випадкові.
Де ми можемо помістити модель з мінімальним відхиленням, наскільки ми можемо бути впевненими, що невідома, непомічена чи незмірна змінна, яка не буде в якийсь момент, кидає нашу модель? Чи крила метелика крилами в Бразилії відтягує смерч в Техасі?
Проблема з використанням лінійних та SVN моделей, які ви згадуєте лише, полягає в тому, що нам дещо потрібно вручну спостерігати за нашими змінними та як вони впливають один на одного. Потім нам потрібно вирішити, які змінні важливі і написати алгоритм, що відповідає специфічній задачі. Це може бути прямо вперед, якщо у нас є лише кілька змінних, але що робити, якщо нас було тисячі? Що, якби ми хотіли створити узагальнену модель розпізнавання образів, чи могли б реально досягти цього підходу?
Глибоке навчання та штучні нейронні мережі (ANN) можуть допомогти нам створити корисні моделі для величезних наборів даних, що містять величезну кількість змінних (наприклад, бібліотеки зображень). Як ви вже згадували, існує незрозуміла кількість рішень, які могли б відповідати даним за допомогою ANN, але чи справді це число відрізняється від кількості рішень, які нам потрібно буде розробити самостійно шляхом спроб та помилок?
Застосування ANN робить велику роботу для нас, ми можемо вказати наші входи та бажані результати (і змінити їх пізніше для вдосконалення) та залишити це до ANN, щоб розібратися у рішенні. Ось чому ANN часто називають "чорними скриньками" . З даного введення вони виводять наближення, однак (загалом) ці наближення не містять деталей про те, як вони були наближені.
І так це дійсно зводиться до того, яку проблему ви намагаєтеся вирішити, оскільки проблема буде диктувати, який модельний підхід корисніший. Моделі не зовсім точні, тому завжди є елемент «помилки», проте чим точніші ваші результати, тим вони корисніші. Детальніше в результатах того, як було зроблено наближення, також може бути корисним, залежно від проблеми це може бути навіть корисніше, ніж підвищена точність.
Якщо, наприклад, ви підраховуєте кредитну оцінку осіб, використовуючи регресію та SVM, ви можете розрахувати, які можна краще вивчити. Дуже корисно мати можливість безпосередньо налаштувати модель і пояснити клієнтам вплив окремих незалежних змінних на загальний бал. ANN може допомогти в обробці більшої кількості змінних для досягнення більш точного показника, але чи буде ця точність кориснішою?