Які математичні передумови для розуміння основної частини алгоритмів у штучному інтелекті та розробки власного алгоритму?
Будь ласка, зверніться до конкретних книг.
Які математичні передумови для розуміння основної частини алгоритмів у штучному інтелекті та розробки власного алгоритму?
Будь ласка, зверніться до конкретних книг.
Відповіді:
Фонд хорошої математики
Почніть з забезпечення повноцінної компетентності з проміжною алгеброю та деякими іншими основами числення та дискретної математики, включаючи термінологію та основні поняття в рамках цих тем.
Основи кібернетики
Норберт Вінер, Кібернетика, 1948, MIT Press, містить поняття часового ряду та зворотній зв'язок з чіткістю та командою, які не спостерігаються в наступних роботах; він також містить вступ до теорії інформації, починаючи з формули журналу Шеннона 2 для визначення кількості інформації в бітах. Це важливо для розуміння розширення концепції ентропії інформації.
Обчислення
Знайдіть хорошу книгу обчислень і переконайтеся, що ви маєте чіткість щодо ключових теорій та застосування в цих категоріях.
Значна частина цього є в Calculus , Strang, MIT, Wellesley-Cambridge Press . Хоча PDF доступний в Інтернеті, він є базовим і не особливо глибоким. Той, що знаходиться в бібліотеці нашої лабораторії, - « Проміжний аналіз» , «Херлі», «Холт Рінехарт і Вінстон», 1980 рік . Він всеосяжний і в чомусь кращий, ніж той, який я маю в домашній бібліотеці, який Прінстон використовує для другокурсників.
Переконайтесь, що вам комфортно працювати в місцях, що перевищують 2 beyond (понад 2D). Наприклад, RNN часто знаходяться в просторах, таких як ℝ 4 thorugh ℝ 7 через горизонтальну, вертикальну, глибину пікселів та розміри кадру відео.
Кінцева математика
Прикро, що жодна з цих трьох книг, про які я думаю, не має всього цього.
Хімія та неврологія
Добре згадати хімічну рівновагу з хімії середньої школи. Баланс відіграє ключову роль у більш досконалих конструкціях AI. Розуміння симбіотичного зв’язку між генеративними та дискримінаційними моделями в GAN допоможе студенту продовжити це розуміння.
Функції контролю в біологічних системах залишаються основним джерелом доказів концепції в дослідженнях штучного інтелекту. Оскільки дослідники стають більш креативними у уявленні форм адаптації, які безпосередньо не імітують якийсь аспект біології (все ще відстань від цього письма), творчість може зіграти більшу роль у формулюванні цілей дослідження AI.
Незважаючи на це, ШІ, ймовірно, залишатиметься значною мірою міждисциплінарною сферою.
Я працюю професором, і нещодавно розробив вимоги до математики для нового спеціального навчального закладу, консультуючись з багатьма колегами з інших установ.
Інші відповіді, зокрема @ FauChrisian's, добре спрацюють з каталогізацією всіх конкретних тем, які можуть бути десь корисними у ШІ, але не всі вони однаково корисні для розуміння основних тем. В інших випадках розуміння теми, по суті, те саме, що розуміння відповідних алгоритмів ШІ, тому ми зазвичай просто навчаємо їх разом, а не приймати необхідні знання. Наприклад, процеси Марковського рішення не важко навчити того, хто вже знає основи теорії графів та ймовірностей, тому ми зазвичай просто висвітлюємо їх, коли ми навчаємо підкріплення в курсі AI, а не як окрема тема математики. звичайно.
Вимоги до математики, які ми вирішили, виглядають так:
Один або два семестрові курси з дискретної математики. Це стільки, щоб встановити комфорт із доказовою та математичною суворістю, як і з будь-якою конкретною темою у цій галузі. Це здебільшого просто "основоположні" знання, але шматочки цього виявляються дуже корисними. Комфорт із нескінченними підсумками, основи графіків, комбінаторика та асимптотичний аналіз - це, мабуть, найбільш безпосередньо застосовні частини. Мені подобається книга Сюзанні Епп .
Один або два семестрові курси лінійної алгебри, які корисні для широкого спектру тем у галузі ІІ, особливо машинного навчання та обміну даними. Lay & Lay - це нормально книга, але, мабуть, не абсолютно найкраща. Шилов - це рекомендація Яна Гудфеллоу та інших, але я сам цього не пробував.
Курс вірогідності та, можливо, сучасний курс статистики (тобто з байєсівською фокусом). Більш старий курс статистики чи той, хто орієнтується на соціальних вчених, не дуже корисний. Мої колеги-статистики зараз користуються Lock5 і мають хороший досвід роботи з ним.
Принаймні диференціальне та інтегральне числення, і, принаймні, принаймні часткові похідні у векторному обчисленні, але, можливо, весь хід. Це корисно в оптимізації, машинному навчанні та на основі економіки підходів до ШІ. Стюарт - найпоширеніший підручник. Це всеосяжно і може використовуватися для всіх трьох курсів, але пояснення не завжди є найкращими. Я все-таки рекомендую.
Це основні теми. Якщо ви також не маєте традиційного досвіду програмування, то курс з теорії графів та асимптотичної складності або проектування та аналізу алгоритмів може стати корисними доповненнями. Зазвичай AI'ers походять зі стандартного фону інформатики, який дуже добре висвітлює всі ці речі.
Що стосується простих алгоритмів, таких як Des Gradient Descent, вам потрібно добре зрозуміти часткові похідні. Особливо, якщо ви хочете реалізувати нейронні мережі. Крім того, більшість алгоритмів векторизовані для підвищення швидкості обчислень, тому вам потрібно бути комфортним з математикою матриці. Це означає бути дійсно швидким і зручним з розмірами матриць, розмірами виробів, множенням матриць, транспоніруванням тощо. Дуже рідко ви можете використовувати матричне обчислення, щоб безпосередньо знайти оптимальні рішення, тому слід зробити кілька результатів з цієї області. Рухаючись далі, потрібно зрозуміти деякий аналіз функцій. це потрібно, щоб зрозуміти, які функції активації, такі як сигмоїд і танг, журнал, виконуються. Зрозуміти ймовірність та очікування також дуже корисно. Ви також повинні бути чіткими з ортогональними векторами та внутрішніми виробами.
Зважаючи на це, я б запропонував вам зрозуміти основні операції обчислення та матриці та спробувати вивчити поняття AI. Якщо ви не можете щось зрозуміти, вивчіть математику.
Примітка: знову це лише для запуску.