Якою мірою потрібна / корисна «просунута математика» в дослідженнях ШІ?


19

Зараз я вивчаю математику. Однак я не думаю, що в майбутньому я хочу стати професійним математиком. Я маю намір застосувати свої знання з математики для проведення досліджень в галузі штучного інтелекту. Однак я не впевнений, скільки курсів математики я повинен пройти. (І які курси теорії CS я повинен пройти.)

Від Quora я дізнався, що предмети Лінійна алгебра, статистика та опукла оптимізація є найбільш актуальними для машинного навчання (див. Це питання). Хтось ще згадував, що для вивчення штучного інтелекту потрібні вивчення лінійної алгебри, ймовірності / статистики, обчислення, основних алгоритмів та логіки (див. Це питання).

Я можу дізнатися про всі ці предмети протягом своїх перших 1,5 років бакалавра з математики в нашому університеті.

Мені все ж було цікаво, чи є якісь вищі студенти навіть з випускників рівня математики, які корисні або навіть потрібні для вивчення штучного інтелекту. А як щодо ODE, PDE, топології, теорії вимірювань, лінійного аналізу, аналізу Фур'є та аналізу на колекторах?

Одна з книг, яка наводить на думку про те, що якась досить передова математика є корисною для вивчення штучного інтелекту, - це Теорія візерунків: Стохастичний аналіз сигналів реального світу Девіда Мамфорда та Агнес Дезольньо (див. Цю сторінку). Він включає глави про ланцюги Маркова, пошарово-гауссові моделі, поля Гіббса, колектори, групи брехні та алгебри Лі та їх застосування до теорії візерунків. Наскільки ця книга корисна в дослідженнях ШІ?


22
в моїх 2+ років на цьому сайті я бачив більше півдесятка запитань типу "для чого мені потрібна математика ...". Відповіді Que, які читаються як зміст Принстонського попутника до математики. 1) AI - це величезне поле, математика, що використовується у його підполях, надходить у всіх смаках; 2) Пройдіть основні курси з математики, виберіть більш просунуті курси на основі інтересів; 3) робіть дослідження в ШІ, знайдіть, що вам подобається, знайдіть, яка математика там використовується; 4) Ми не можемо знати, що математика буде корисною для тієї чи іншої проблеми.
Сашо Ніколов

Відповіді:


57

Я не хочу звучати поблажливо, але математика, яку ви вивчаєте на бакалавраті та навіть на курсах аспірантури, не просувається. Це основи . Назва вашого питання повинна бути такою: чи потрібна / корисна "основна" математика в дослідженні AI? Тож, гулячи, скільки завгодно, я ніколи не зустрічав вченого-комп’ютера, який скаржився на те, що знає занадто багато математики, хоча я зустрічав багатьох, хто скаржився на те, що не знає цього достатньо. Я пам’ятаю, як допомагав аспіранту в AI зрозуміти алгоритм стилю сторінок. Для мене це була просто легка лінійна алгебра, але він страждав, бо не мав почуття щодо власних значень та власних векторів. Уявіть, що AI люди могли зробити, якби насправді знали багато математики!

Я викладаю на кафедрі математики, і я регулярно отримую прохання від колег по CS, щоб рекомендувати математичні спеціальності для кандидата технічних наук, вони віддають перевагу студентам з математики. Розумієте, математику справді, дуже важко навчитися самостійно, але більшість аспектів інформатики це не так. Я знаю, я був спеціалістом з математики, який потрапив до аспірантури CS. Звичайно, я був «позаду» щодо знань операційних систем (незважаючи на те, що я мав гідні знання про Unix та VMS), але я пройшов шлях вперед по «теорії». Це не симетрична ситуація.


6
теорія вимірювань та теорія ймовірностей є основою для всіх імовірнісних міркувань. топологія стала дуже важливою для аналізу топологічних даних. Аналіз Фур’є є важливим для теорії навчання (він використовується для розуміння чутливості функцій і того, як їх важко засвоїти), а багатозначне навчання вимагає глибокого розуміння геометрії багатоманітності.
Суреш Венкат

2
@MaxMuller: І щоб продовжити список, теорія груп та алгебраїка (як алгебри Лі) широко використовуються для розпізнавання візерунків у теорії декомпозиції зображень, де топологія вкрай необхідна (і між алгебрами Лі та багатовиділеннями існує глибокий зв’язок вчитися по дорозі). Книги, такі як "Основи розпізнавання візерунків" Моніки Павла, навіть введуть вас у теорію категорій та її застосування, що також є надзвичайно важливим для ШІ для її використання в основах формальних мов та теорії доказів (що може бути теорією міркувань) ...
ex0du5

1
Минулі курси Grad рівня інтро, математика дізнатися всі їхні математику самостійно (або в читацьких групах і семінарах) .. це не все , що важко , якщо у вас є якесь - то підстава ... добре, це може бути важко, але не неможливо.
Сашо Ніколов

1
Макс, я також вчу айкідо. Я не пригадую, щоб жоден з учнів айкідо запитував "чому я повинен засвоїти ази (як падати, як рухатися з лінії атаки)?" Іноді вам потрібно трохи довіритися, що ваші вчителі знають, що вони роблять. Однак я першим визнаю, що ми навчаємо багато лайна, особливо в середніх школах та початкових школах, де викладають математику так, ніби метою було придушити цікавість учнів. Але у вашому випадку суб’єкти, які ви перерахували, вони не лайно. Довірся мені.
Андрій Бауер

13
І ще один коментар. Якщо ви вивчите лише математику, яка вже виявилася корисною в якійсь області CS, ви ніколи не зможете застосувати нову математику. Ви завжди будете позаду. Наука - це мистецтво, а не робота з 5 на 5. Якщо ви запитаєте мене "чи повинен я вчитися фізиці, я хочу потрапити в ШІ", я скажу "абсолютно так!" І якщо ви запитаєте "чи слід вивчати соціологію, я хочу потрапити на ШІ", моя відповідь все одно буде однаковою.
Андрій Бауер

6

Макс, ось (обов'язково) частковий список:

Основна лінійна алгебра та ймовірність потрібні всюди. Я думаю, вам не потрібні посилання на це.

Наскільки мені відомо, Фур'є-аналіз був використаний у дослідженні, пов'язаному з навчанням. Наприклад, ознайомтеся з цим документом .

Концепція багатозначного навчання стає все більш популярною, і ви можете почати дивитися на твори Михайла Белкіна та Партха Нійогі. Цей напрямок роботи вимагає розуміння різних понять, пов'язаних з багатоманіттями та римановою геометрією.

Є ще один аспект машинного навчання, який має більш глибоке коріння в статистиці, а саме - геометрія інформації. Ця область пов'язана в різних концепціях риманової геометрії, теорії інформації, інформації про Фішера тощо. Двоюрідний брат такого роду дослідження може бути знайдений в алгебраїчній статистиці - це зароджене поле з великим потенціалом.

Суміо Ватанабе досліджував іншу межу, а саме існування особливості в моделях навчання та способи застосування глибоких результатів резолюцій з алгебраїчної геометрії для вирішення багатьох питань. Результати Ватанабе значною мірою залежать від знаменитої роботи Хейсуке Хіронаки, яка здобула йому медаль Поля.

Я припускаю, що я опускаю багато інших областей, які потребують порівняно важкої математики. Але, як зазначив Андрій, більшість із них, ймовірно, не лежать на кордонах математики, а є відносно старшими та усталеними областями.

У будь-якому випадку, я вважаю, що теперішній стан AI, який увійшов в обчислювальні процеси - наприклад, в системах рекомендацій в Amazon або в бібліотеках машинного навчання, знайдених в Apache Mahout, не вимагає ніякої розширеної математики. Я можу помилятися.


2

Залежить від вашого визначення вищої кваліфікації та того, який ІІ ви хочете вивчити.

Багато проблем AI є, очевидно, нерозв'язними - оптимальні рішення POMDP є, мабуть, NP-завершеними, оптимальні рішення DEC-POMDPs, очевидно, NEXP-Complete і т. Д. Отже, відсутній деякий несподіваний прорив в теорії складності, тим більше, хто знає про алгоритми наближення і їх теоретичні основи, тим краще. (Окрім теорії вимірювань тощо), необхідного для того, щоб по-справжньому зрозуміти байєсівську ймовірність, що лежить в основі моделі POMDP.)

Багатоагентний штучний інтелект, зокрема, перетинається з теорією ігор; тому корисне знання теорії ігор, яке, в свою чергу, залежить від топології, теорії мір тощо. І так само багато проблем теорії ігор є нерозв'язними. Деякі з них навіть неприступні для наближення, і навіть розуміння, коли можна корисно наблизити, потребує значної кількості математики для відпрацювання.

(Зауважу, що теоретики ігор протягом останніх кількох років ведуть досить непоганий досвід у галузі Нобелівської економіки, і це сильно математичний характер. Я прогнозую, що через двадцять непарних років сьогоднішні теоретики алгоритмічної гри будуть приблизно приблизно однаковими. положення.)


1

Математика, що бере участь у ШІ, не є вищою, і викладається на нижчому рівні. Алгоритми навчання тренінгів та інтелектуального інтелекту належать до сфери передових комп'ютерних наук.

Це трохи гра в слова. Деяка історія також повинна бути включена при дослідженні ШІ.

Наприклад, у поточній номенклатурі глибоке навчання здається актуальним ключовим словом в AI.

Глибоке навчання - це те, що раніше називалося штучними нейронними мережами (ANNs), такими як зворотна пропагуюча мережа моделі сприймання Hinton (BACKPROP) тощо.

Математика, що бере участь у BACKPROP ANN (наприклад), по суті є похідним обчисленням для тренувань, і матричною алгеброю для зараження.

Новим аспектом глибокого навчання є фізичне розділення алгоритмів навчання та посилення. Процесори все ще використовуються для навчання, але зараз GPU використовуються для зараження.

Наприклад, матриці ANN тренуються (зважуються) за допомогою помилок зворотного розповсюдження з використанням корекційного числення похідних. Це найкраще підходить для процесорів, і їх потрібно виконувати лише один раз за розгортання ANN.

Потім ANN розгортається у високо паралельній архітектурі GPU. Математика прямого посягання включає в себе інтенсивну алгебру матриці, для якої розроблені графічні процесори.

Це підвищує ефективність розгорнутого ANN на кілька порядків порівняно з попередніми розгортаннями на базі процесора і може бути ефективніше масштабовано для будь-якої кількості виділених графічних процесорів.

Такі компанії, як Nvidia та AMD, зараз продають чіпсети GPU високого класу як Deep Learning Machines. Термін GPU завжди був дещо помилковим, оскільки вони справді є паралельними процесорами загального призначення. Наприклад, графічні процесори також іноді називаються бітмінерами в додатках blockchain.

Тож те, що було старим, тепер нове. Математика, що займається, не змінилася, лише термінологія інформатики (в основному через маркетинговий тиск).

Термін AI завжди вважався трохи темним конем. «Глибоке навчання» - це політично правильний, сприятливий для ринку термін.


2
Попередній відповідь вже дав контрприклади до вашої претензії в першому реченні. (Є також багато інших.) Чи читали ви попередні відповіді перед публікацією? Ви можете відредагувати цю відповідь, щоб звузити ваші претензії.
DW

2
Ваша заява про те, що "процесори все ще використовуються для навчання [глибоких мереж], але тепер GPU використовуються для зараження", є досить оманливим (якщо не неправильним). Усі тренують сучасні нейронні мережі на GPU. Більшість людей також розгортає їх на графічних процесорах, але деякі середовища розгортання (наприклад, деякі мобільні телефони) все ще використовують процесори.
Майк Ізбіцький

Я згоден з Майком. "Графічні процесори використовуються для тренінгу, а ЦП для зараження" - менш невірно, ніж сказати, що "ЦП використовуються для тренінгу, а GPU - для зараження"
ASDF

@MikeIzbicki Трубопровідні архітектури, такі як CUDA, OpenCL тощо, необхідні для навчання «глибокому навчанню», яке сильно покладається на ядра CPU для виправлення помилок. Для підведення конвеєрів потрібні лише ядра CPU для живлення та збирання ядер GPU. Потужність і теплова ефективність - це мета, тому баланс між основними типами зміщується між тренуванням і спорядженням. Що це я вже сказав.
Birkensocks

-1

AI - це надзвичайно широке поле з широким спектром можливих маршрутів. Деякі надзвичайно математичні, деякі ледь торкаються математики. Інші вже дали хороші відповіді на більш математичні підходи. З предметів, на які ви вказали:

"Лінійна алгебра, ймовірність / статистика, обчислення, основні алгоритми та логіка"

-в основному вам потрібно чи виграєте від них усі. Багато підходів принаймні частково безпосередньо базуються на вірогідності та статистиці - евристика, нейронні мережі, генетичні алгоритми, нечітка логіка. Обчислення не менш корисне - в ІІ або загалом обчислювальній науці ви знайдете його майже скрізь. Лінійна алгебра - це теж те, що вам точно потрібно.

Два найважливіші предмети з точки зору CS / AI - це алгоритми та логіка, алгоритми - справжнє серце обчислювальної науки, а логіка - основна "мова" алгоритмів. Ключ до алгоритмів навчання, хоча це навчання програмуванню, майстерність а практика з базового програмування - одна з найважливіших основ майже всіх предметів інформатики чи ІІ. Програмування також є вмінням, яке університети не завжди особливо добре навчають. Логіка також дуже важлива для більшості галузей ШІ; Булева логіка, обчислення предикатів, символічна логіка, основні теорії перестановки, ієрархія дизайну, рекурсія, машини кінцевого стану, машини Тюрінга, дизайн процесора тощо. Тут ми дійсно відходимо від математики до власних обчислень.

Розширення мого власного поля математики «Сильний ШІ» відіграє основну, але абсолютно істотну роль. Дуже добре розуміння базової математики, мабуть, важливіше, ніж вища математика, але насправді все, що ви підберете, може бути корисним. Справжня проблема в зароджуваному полі, як Сильний ШІ, полягає в тому, що все знаходиться в повітрі, і це поле знаходиться в повному потоці.
Предмети, які можуть бути корисними, включають: нейронні мережі, генетичні алгоритми, неврологія, генетика, психологія, кібернетика та робототехніка, теорія 3D графіки, теорія обробки зображень, дизайн комп'ютерних ігор, філософія, теорія мистецтва, цифрова електроніка, теорія лінгвістики. як це читання - один з найважливіших способів навчання. Кілька книг, які були для мене вихідними точками, були: «Новий розум імператорів» Роджера Пенроуза, «Око та мізг» Р. Л. Григорія, але справді розуміння може з’явитися майже з будь-якого місця

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.