Які математичні предмети ви б запропонували підготувати до видобутку даних та машинного навчання?


30

Я намагаюся скласти самостійну навчальну програму з математики для підготовки до вивчення даних та машинного навчання. Це мотивовано початком уроку машинного навчання Ендрю Нг на Coursera і відчуттям, що перед тим, як продовжувати, мені потрібно вдосконалити свої навички математики. Нещодавно я закінчив коледж, тому моя алгебра та статистика (конкретно на уроках політології / психології) іржаві.

Відповіді в потоці Чи є сильним фоном у математиці загальний реквізит для ML? пропонувати лише книги або заняття, безпосередньо пов'язані з машинним навчанням; Я вже розглядав деякі з цих класів і книг і не знаю, що саме математика підлягає вивченню (наприклад: яке поле [s] математичної адреси, що походить з рівняння, щоб "мінімізувати функцію витрат"?). Інший потік запропонований ( Навички та курсові роботи повинні бути аналітиками даних ) лише згадують широкі категорії навичок, необхідних для аналізу даних. Нитка Вступ до статистики для математиків не застосовується, оскільки я вже не маю наукового ступеня з математики; подібний потік Математик бажає еквівалентних знань за ступенем статистики якості має неймовірний перелік книг із статистикою, але знову ж таки, я дивлюся на те, щоб почати математику з іржавого спогаду алгебри та рухатися звідти.

Отже, для тих, хто працює в машинному навчанні та обробці даних, які сфери математики ви вважаєте важливими для своєї роботи? Які математичні предмети ви б запропонували підготувати до вилучення даних та машинного навчання та в якому порядку? Ось перелік та порядок, який я мав досі:

  • Алгебра
  • Попереднє обчислення
  • Обчислення
  • Лінійна алгебра
  • Ймовірність
  • Статистика (тут багато різних підполів, але не знаю, як їх розбити)

Що стосується видобутку даних та машинного навчання, то через свою теперішню роботу я маю доступ до записів про діяльність веб-сайтів / додатків, транзакцій клієнтів / передплати та даних про нерухомість (як статичних, так і часових рядів). Я сподіваюся застосувати обробку даних та машинне навчання до цих наборів даних.

Дякую!

Редагувати:

Заради нащадків я хотів поділитися корисною математичною самооцінкою для вступу Джеффрі Гордона / Алекса Смоли в клас машинного навчання в КМУ.


3
Що стосується передумов для занять у Курсі, ця інформація повинна бути доступною десь у їхніх матеріалах. Поза їх класів / загалом, питання про те, яка математика вам потрібна для stat / ML / DM, вражає мене як дублікат. У резюме, що висвітлює цей матеріал, є декілька тем, серед яких: a-strong-background-in-maths-a-Requicite-for ml , & skills-курсові роботи, необхідні для того, щоб стати аналітиком даних ( можливо, серед інших).
gung - Відновіть Моніку

1
Перегляньте ці теми, теми, які пов’язані там, як тісно пов’язані між собою, і, можливо, пошукайте на сайті. Якщо у вас все-таки виникає запитання після прочитання, поверніться сюди та відредагуйте цей Q, щоб зробити його більш чітким / уточнити, що ще потрібно знати, що не було висвітлено в інших місцях.
gung - Відновіть Моніку

Відповіді:


15

Пропозиції @gung, безумовно, варто дотримуватися. Пройшовши курс курсу, я думаю, що ваш список - це гарний початок. Деякі коментарі:

  1. лінійна алгебра та матрична алгебра - це одне і те ж, тому відкиньте останню.
  2. в обчислення обов'язково включайте часткову диференціацію. Це обчислення застосовується до функцій більш ніж однієї змінної (символічно, якщо, скажімо, є функцією і то ви хочете а не ). На щастя, це не складно.zхуzхгzгх
  3. в обчисленні вам не потрібно нічого, крім базової інтеграції (а може, навіть і не того). Це щастило, бо інтеграція важка.
  4. додайте базову оптимізацію, тобто знайдіть максимальний або мінімум функції, як правило, функцію більш ніж однієї змінної. Оцінка градієнтного спуску як мінімум є важливою.
  5. з точки зору складності, напевно, ви хочете бути десь між початком і кінцем першого курсу.
  6. спробуйте прочитати деякі основні тексти ймовірності та статистики в Інтернеті чи іншим чином, але не переживайте занадто сильно (основна математика все одно є необхідною умовою для розуміння ймовірності та статистики). Якщо ви будете робити такі курси, як той, який ви пропонуєте, ви зрозумієте, що вам потрібно навчитися та де ваші інтереси. Одне, що вам не хочеться робити, принаймні спочатку, - це витратити багато часу на вивчення тестування гіпотез. Ви б краще хотіли орієнтуватися на розуміння базової статистики - випадкових змінних, розподілу ймовірностей (PFD, CDFs), описової статистики, - а потім спробувати зрозуміти регресію.

5

На цьому форумі є декілька чудових тем, серед яких ЦЕ ОДНЕ, яке я знайшов для мене особливо корисним у плані розвитку концептуальної схеми важливих навичок роботи з інформацією.

Як було сказано вище, доступно багато онлайн-курсів. Наприклад, зараз у Coursera є спеціалізація з наукових даних з низкою курсів, які, ймовірно, охоплюють деякі інструменти, які знадобляться для вашої роботи.


3

Якщо ви хочете скористатися інформацією про машинне навчання / обмін даними, я б настійно закликав оптимізувати / лінійну алгебру / статистику та ймовірність. Ось перелік книг на вірогідність. Сподіваюся, що це допомагає.


3

Що стосується чищення дуже базових математичних навичок, я використовую ці книги:

Елементи математики для економіки та фінансів. Mavron, Vassilis C., Phillips, Timothy N У цій книзі висвітлюються основні математичні навички (додавання субстракції), часткове розмежування, інтеграція, матриця та детермінанти, а також невелика глава про оптимізацію, а також диференціальне рівняння. Він орієнтований на економіку та фінанси, але це невелика книга, послідовність розділів відповідає моїм потребам і легко читається для мене.

Статистичний аналіз: Microsoft Excel 2010. Конрад Карлберг охоплює базовий статистичний аналіз, багаторазову регресію та аналіз коваріації, і він використовує excel.

Виявлення статистики за допомогою Р. Енді Філда, Джеремі Майлза, Зої Поля. Ще не читав. У ньому використовується Р.

Елементарна лінійна алгебра. Рон Ларсон, Девід К. Фальво.

Матричні методи: прикладна лінійна алгебра Річард Бронсон, Габріель Б. Коста. охоплює елементарну лінійну алгебру та матричне числення

Це основні книги з математики, які я використовую для відновлення даних / машинного навчання

Сподіваюся, це допомагає


3

Є досить багато відповідних ресурси , перераховані (і класифіковані) тут , в так званому «Open Source Data Science Masters».

Спеціально для математики вони перераховують:

  1. Лінійна алгебра та програмування
  2. Статистика
  3. Диференціальні рівняння та обчислення

Досить загальні рекомендації, хоча вони перелічують деякі підручники, які можуть вам бути корисними.


2
  • Ймовірність та статистика є важливими. Деякі ключові слова - це тест гіпотези, багатоваріантний нормальний розподіл, байєсівський умовивід (спільна ймовірність, умовна ймовірність), середнє значення, дисперсія, коваріація, розбіжність Куллбека-Лейблера, ...
  • Основна лінійна алгебра важлива для машинного навчання. Теми, які ви могли б вивчити, - це розпад власності та розкладання сингулярного значення. (Звичайно, ви повинні знати, як обчислити матричний добуток.)
  • Як вже говорилося в TooTone: важлива оптимізація. Ви повинні знати, що таке градієнтний спуск, і, можливо, подивіться на метод Ньютона, Левенберг-Маркард, Бройден-Флетчер-Гольдфарб-Шенно.
  • Обчислення не є таким важливим, але може бути корисним знати обчислення часткових похідних функцій (матриця Якобі, матриця Гессе, ...), і ви повинні знати, що таке інтеграл.

0

Лінійна алгебра, статистика, обчислення. Я думаю, ви можете навчитися їх у тандемі з МЛ - або навіть після основ. Курси / книги для початківців роблять чудову роботу з розділами математичних букварів, а ви вивчаєте основи математики, вивчаючи ML. Я зробив епізод подкастів з математики, необхідної для машинного навчання, та ресурсів для їх вивчення: Посібник з машинного навчання № 8


0

Перш ніж розпочати будь-який курс машинного навчання, пройдіть наступний курс математики. Також не намагайтеся копатися однією спробою. Вивчіть основні поняття, потім знову підберіть свої навички з математики і повторіть: -

Теми з математики є такими:

  • Лінійна алгебра
  • Ймовірність
  • Основний розрахунок
  • Максими і мінімуми функції
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.