Які математичні передумови для дослідника ШІ?


12

Які математичні передумови для розуміння основної частини алгоритмів у штучному інтелекті та розробки власного алгоритму?

Будь ласка, зверніться до конкретних книг.

Відповіді:


9

Фонд хорошої математики

Почніть з забезпечення повноцінної компетентності з проміжною алгеброю та деякими іншими основами числення та дискретної математики, включаючи термінологію та основні поняття в рамках цих тем.

  • Нескінченний ряд
  • Логічні докази
  • Лінійна алгебра та матриці
  • Аналітична геометрія, особливо відмінність локальних і глобальних крайнощів (мінімумів і максимумів), сідлових точок і точок перегину
  • Теорія множин
  • Ймовірність
  • Статистика

Основи кібернетики

Норберт Вінер, Кібернетика, 1948, MIT Press, містить поняття часового ряду та зворотній зв'язок з чіткістю та командою, які не спостерігаються в наступних роботах; він також містить вступ до теорії інформації, починаючи з формули журналу Шеннона 2 для визначення кількості інформації в бітах. Це важливо для розуміння розширення концепції ентропії інформації.

Обчислення

Знайдіть хорошу книгу обчислень і переконайтеся, що ви маєте чіткість щодо ключових теорій та застосування в цих категоріях.

  • Часовий ряд
  • Нескінченний ряд
  • Конвергенція - Штучні мережі в ідеалі сходяться до оптимальних під час навчання.
  • Часткові диференціали
  • Якобійська та гессійська матриці
  • Багатовимірна математика
  • Прикордонні регіони
  • Дискретна математика

Значна частина цього є в Calculus , Strang, MIT, Wellesley-Cambridge Press . Хоча PDF доступний в Інтернеті, він є базовим і не особливо глибоким. Той, що знаходиться в бібліотеці нашої лабораторії, - « Проміжний аналіз» , «Херлі», «Холт Рінехарт і Вінстон», 1980 рік . Він всеосяжний і в чомусь кращий, ніж той, який я маю в домашній бібліотеці, який Прінстон використовує для другокурсників.

Переконайтесь, що вам комфортно працювати в місцях, що перевищують 2 beyond (понад 2D). Наприклад, RNN часто знаходяться в просторах, таких як ℝ 4 thorugh ℝ 7 через горизонтальну, вертикальну, глибину пікселів та розміри кадру відео.

Кінцева математика

Прикро, що жодна з цих трьох книг, про які я думаю, не має всього цього.

  • Направлені графіки - Дізнайтеся це ДО ДЕРЕВІНІ ДРУГІВ або СТРУКТУР (штучні сітки), тому що це суперпоточна топографія всіх цих конфігурацій
  • Абстрактні дерева символів (ASTs)
  • Розширена теорія множин
  • Дерева рішень
  • Марківські ланцюги
  • Теорія хаосу (особливо різниця між випадковим та псевдовипадковим)
  • Теорія ігор , починаючи з фон Неймана і Моргенштерна Теорія ігор , основоположною роботи в цій галузі
  • Конвергенція в дискретних системах, особливо застосування теорії для насичення сигналу в цілій, фіксованій точці або арифметиці з плаваючою точкою
  • Статистичні засоби, відхилення, кореляція та більш прогресивні поняття ентропії, відносної ентропії та перехресної ентропії
  • Крива підгонка
  • Звитий
  • Ймовірність, особливо, теорема Байєса
  • Алгоритмічна теорія (теореми про невизначеність Геделя та повнота Тюрінга)

Хімія та неврологія

Добре згадати хімічну рівновагу з хімії середньої школи. Баланс відіграє ключову роль у більш досконалих конструкціях AI. Розуміння симбіотичного зв’язку між генеративними та дискримінаційними моделями в GAN допоможе студенту продовжити це розуміння.

Функції контролю в біологічних системах залишаються основним джерелом доказів концепції в дослідженнях штучного інтелекту. Оскільки дослідники стають більш креативними у уявленні форм адаптації, які безпосередньо не імітують якийсь аспект біології (все ще відстань від цього письма), творчість може зіграти більшу роль у формулюванні цілей дослідження AI.

Незважаючи на це, ШІ, ймовірно, залишатиметься значною мірою міждисциплінарною сферою.


2
Деякі коментарі: 1) Я погоджуюся з тим, що Джон писав у своїй відповіді, що його відповідь стосується більш загального "ядра", тоді як ваш включає речі, які можуть бути корисними, а можуть і не залежати від того, в яку область ІП хтось потрапляє. 2) Багато речей, які ви описуєте в розділі "середня школа математики", не є (обов'язково) середньою школою, принаймні, не в Європі (не знаю про США). У Нідерландах я не отримав жодної лінійної алгебри, матриць, нескінченних рядів чи теорії множин до мого першого курсу в університеті. Деякі з них, можливо, з’являться раніше, якби я вибрав інший набір курсів у середній школі.
Денніс Сомерс

2
3) Функціональний аналіз / теорія вимірювань може бути корисним для включення в деяких областях. Але, знову ж таки, це дуже дуже залежить від того, наскільки глибоко ви хочете піти дослідником ШІ. Деякі дослідники ШІ з більш теоретичної сторони речей вважають майже всі ці речі корисними. Іншим дослідникам ШІ більше на емпіричному / програмному / програмному рівні потрібно набагато, значно менше. Обидва можуть все-таки дати високоцінні дослідження.
Денніс Сомерс

7

Я працюю професором, і нещодавно розробив вимоги до математики для нового спеціального навчального закладу, консультуючись з багатьма колегами з інших установ.

Інші відповіді, зокрема @ FauChrisian's, добре спрацюють з каталогізацією всіх конкретних тем, які можуть бути десь корисними у ШІ, але не всі вони однаково корисні для розуміння основних тем. В інших випадках розуміння теми, по суті, те саме, що розуміння відповідних алгоритмів ШІ, тому ми зазвичай просто навчаємо їх разом, а не приймати необхідні знання. Наприклад, процеси Марковського рішення не важко навчити того, хто вже знає основи теорії графів та ймовірностей, тому ми зазвичай просто висвітлюємо їх, коли ми навчаємо підкріплення в курсі AI, а не як окрема тема математики. звичайно.

Вимоги до математики, які ми вирішили, виглядають так:

  • Один або два семестрові курси з дискретної математики. Це стільки, щоб встановити комфорт із доказовою та математичною суворістю, як і з будь-якою конкретною темою у цій галузі. Це здебільшого просто "основоположні" знання, але шматочки цього виявляються дуже корисними. Комфорт із нескінченними підсумками, основи графіків, комбінаторика та асимптотичний аналіз - це, мабуть, найбільш безпосередньо застосовні частини. Мені подобається книга Сюзанні Епп .

    • Один або два семестрові курси лінійної алгебри, які корисні для широкого спектру тем у галузі ІІ, особливо машинного навчання та обміну даними. Lay & Lay - це нормально книга, але, мабуть, не абсолютно найкраща. Шилов - це рекомендація Яна Гудфеллоу та інших, але я сам цього не пробував.

    • Курс вірогідності та, можливо, сучасний курс статистики (тобто з байєсівською фокусом). Більш старий курс статистики чи той, хто орієнтується на соціальних вчених, не дуже корисний. Мої колеги-статистики зараз користуються Lock5 і мають хороший досвід роботи з ним.

    • Принаймні диференціальне та інтегральне числення, і, принаймні, принаймні часткові похідні у векторному обчисленні, але, можливо, весь хід. Це корисно в оптимізації, машинному навчанні та на основі економіки підходів до ШІ. Стюарт - найпоширеніший підручник. Це всеосяжно і може використовуватися для всіх трьох курсів, але пояснення не завжди є найкращими. Я все-таки рекомендую.

Це основні теми. Якщо ви також не маєте традиційного досвіду програмування, то курс з теорії графів та асимптотичної складності або проектування та аналізу алгоритмів може стати корисними доповненнями. Зазвичай AI'ers походять зі стандартного фону інформатики, який дуже добре висвітлює всі ці речі.


1
@FauChristian Я думаю, що ми перерахували одні і ті ж теми: Обчислення і кінцева математика точно. Ми обидва вважаємо, що вам слід пройти по кілька занять у кожному. Я перерахував статистику та ймовірність. Я думаю, що якщо ти хочеш робити сучасну роботу в ШІ, без цього ти далеко не дістанешся. Ви перерахували хімію та нейронауку. Я думаю, що мало хто з AI'er вважає це необхідною темою. Звичайно, ви можете пройти весь Russell & Norvig без нього. Якщо ви хочете працювати в обчислювальній нейронауці (не глибокому навчанні), це може бути корисним. Я також сумніваюся, що вам потрібно 16 років, щоб зробити внесок. 5-6 напевно, хоча.
Джон Дукетт

1
@FauChristian Це все правда. Я схильний вважати, що якби ви хотіли займатися дослідженнями в більшості сучасних лабораторій ШІ, вам все одно потрібна ймовірність (принаймні половина сучасної роботи в ІІ - це якесь машинне навчання, і значна частина цього - в глибокому навчанні) . Як правило, аспіранти виконують науково-дослідну роботу. Більшість з них займаються науково-дослідною роботою лише через 1-2 роки аспірантури. Деякі з них навіть досить непогані. Ці люди мали лише 4-6 років формальної освіти з цього предмету, максимум. Більше цього може зробити вас швидшими або глибшими, але дослідницький потенціал починається там.
Джон Дукетт

3

Що стосується простих алгоритмів, таких як Des Gradient Descent, вам потрібно добре зрозуміти часткові похідні. Особливо, якщо ви хочете реалізувати нейронні мережі. Крім того, більшість алгоритмів векторизовані для підвищення швидкості обчислень, тому вам потрібно бути комфортним з математикою матриці. Це означає бути дійсно швидким і зручним з розмірами матриць, розмірами виробів, множенням матриць, транспоніруванням тощо. Дуже рідко ви можете використовувати матричне обчислення, щоб безпосередньо знайти оптимальні рішення, тому слід зробити кілька результатів з цієї області. Рухаючись далі, потрібно зрозуміти деякий аналіз функцій. це потрібно, щоб зрозуміти, які функції активації, такі як сигмоїд і танг, журнал, виконуються. Зрозуміти ймовірність та очікування також дуже корисно. Ви також повинні бути чіткими з ортогональними векторами та внутрішніми виробами.

Зважаючи на це, я б запропонував вам зрозуміти основні операції обчислення та матриці та спробувати вивчити поняття AI. Якщо ви не можете щось зрозуміти, вивчіть математику.

Примітка: знову це лише для запуску.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.