Я хотів би дізнатися про теорію ймовірностей, теорію вимірювань та нарешті машинне навчання. З чого я починаю? [зачинено]


9

Я хотів би дізнатися про теорію ймовірностей, теорію вимірювань та нарешті машинне навчання. Моя кінцева мета - використовувати машинне навчання у складі програмного забезпечення.

Я вивчав обчислення і дуже основну ймовірність в коледжі, але це майже все. Чи знаєте ви деякі онлайн-курси чи книги, які я міг би використати для вивчення цих предметів. Я знайшов багато ресурсів в Інтернеті, але всі вони здаються націленими на експертну аудиторію. Я знаю, що це займе певний час, але з чого почати, якщо я хотів би вчитися з самого початку?



2
Ці три питання здаються досить добре висвітленими дублікатами, переліченими @General.
whuber

Відповіді:


13

Я думаю, що для вас існують дві дуже хороші та популярні довідники (я почав саме з них, маючи досвід магістра в галузі актуарної науки):

  1. Вступ до статистичного навчання (із застосуванням на R) Гарет Джеймс, Даніела Віттен, Тревор Хасті, Роберт Тібшірані. Він є у вільному доступі на сайті, досить вичерпний та легкий для розуміння на практичних прикладах. Ви можете почати вивчати багато речей навіть без дуже сильного статистичного підґрунтя. Це посилання є корисним для різних профілів і включає адекватну кількість популярних алгоритмів разом з його реалізацією в R, не заглиблюючись у математичні деталі.

  2. Елементи статистичного навчання Тревора Хасті, Роберта Тібшірані, Джерома Фрідмана . Якщо порівнювати з першою, ця книга заглиблюється в математичні аспекти, якщо ви хочете далі вивчити конкретні алгоритми, які ви вважаєте корисними для вас. ( безкоштовно також)

І звичайно, Cross Valified - це одне з найкращих джерел, з якого ви можете дізнатися багато речей, для мене: найкращі доповіді, статистичне непорозуміння та неправильне використання та багато іншого. Після кількох років навчання в школах / університетах, а також навчання сефту, я виявив, що мої знання є надто обмеженими, коли я вперше перейшов до перехресної перевірки. Я продовжую їздити сюди щодня з моменту першого візиту і так багато вчуся.


3
Якщо вам подобаються ці посилання, не забудьте стежити за онлайн-курсами Стенфорда. Т. Хасті та Р. Тібшірані часто проводять курси, пов'язані з машинним навчанням.
Marcel10

Я прочитав близько 20% вступу до статистичного навчання із застосуванням у Р. Це саме те, що я шукав. Чудова книга і досить легко зрозуміти. Дуже дякую! :)
Макс

6

Ось кілька безкоштовних онлайн-курсів, які я чув, настійно рекомендую:

  • http://projects.iq.harvard.edu/stat110/home (Залежно від вашого поточного комфорту з теорією ймовірностей. Курс доктора Бліцштейна став дуже популярним у Гарварді навіть для тих, хто не був у статистиці / ймовірності. Я спостерігав декілька лекцій для мого власного огляду і вважають їх дуже корисними.)
  • https://www.coursera.org/learn/machine-learning (Це поточна версія одного з перших масових онлайн-курсів Стенфорда Ендрю Нг, який закінчив співзасновник Coursera. Я мав намір взяти курс , але не встигли.)

5

вам не потрібна теорія вимірювань. Теорія вимірювань використовується математиками для обгрунтування інших математичних процедур, наприклад, обмеження наближень інтегралів. Більшість інженерів не вивчали б теорію вимірювань, вони просто використали результати. Математичні знання, необхідні для ML, грубо характеризуються можливістю інтегрувати багатовимірний гауссов. Якщо ви впевнені в цьому, то, ймовірно, вам потрібні багатовимірні числення, лінійна алгебра та теорія ймовірностей.

Я б рекомендував Think Stats від Allen Downey - метою якого є викладання ймовірності / статистики для програмістів. Ідея полягає у використанні досвіду програмування для моделювання, а отже, розуміння теорії ймовірностей / статистичних методів. блог Аллена Дауні (він написав інші) Подумайте статистику (безкоштовно) pdf )


4
Теорія вимірювань корисна при безперервних стохастичних процесах у часі. Насправді, кожен документ із безперервного фінансування часу (ціноутворення активів) починається з наступної молитви(F,Ω,P)
Аксакал,

@Aksakal не тільки безперервні процеси на мою думку!
Менаріат

5

Оскільки ви зацікавлені в машинному навчанні, я пропустив би ймовірність і поміркованість, і стрибнув прямо в ML. Ендрю Нг курси е - чудове місце для початку. Ви можете буквально закінчити це за два тижні.

Пограйте з тим, що ви навчилися протягом декількох тижнів, а потім поверніться до коренів і вивчіть деякі ймовірності. Якщо ви інженер, то я спантеличений тим, як вам вдалося пропуститись у коледж. Раніше це був необхідний курс техніки. У будь-якому випадку ви можете наздогнати, пройшовши тут курс MIT OCW .

Я не думаю, що вам потрібна теорія вимірювань. Нікому не потрібна теорія вимірювань. Ті, хто це робить, вони не прийдуть сюди просити, тому що їхній радник скаже їм, який курс пройти. Якщо у вас немає радника, то вам точно не потрібен. Тавтологія, але правда.

Справа з теорією міри полягає в тому, що ви не можете її навчитися "легким читанням". Ви повинні робити вправи і проблеми, в основному, робити це важко. Це, на мій погляд, практично неможливо поза класною кімнатою. Найкращий варіант тут - взяти заняття в місцевому коледжі, якщо вони пропонують таке. Іноді курс імовірностей рівня доктора наук дозволить зробити вимір та ймовірності в одному класі, що, мабуть, найкраща угода. Я б не рекомендував приймати клас теоретичної міри в кафедрі математики, якщо ви справді не хочете катувати себе, хоча, врешті-решт, ви будете дуже задоволені.


2

Для машинного навчання я думаю, що машинне навчання: мистецтво та наука алгоритмів, які викликають сенс даних Пітера Флаха, може стати хорошим ресурсом для початку. Це дає загальне вступ до машинного навчання з інтуїтивними прикладами, і підходить для початківців. Особливо мені подобається ця книга через останню главу, яка стосується експериментів машинного навчання. Під час навчання машинному навчанню, ознайомлення з різними моделями недостатньо, і треба мати можливість порівнювати різні алгоритми машинного навчання. Я думаю, що ця книга спростила зрозуміти, як порівнювати ці алгоритми. Слайди лекцій можна знайти тут .


2

Щоб додати до відмінних пропозицій вище, я б сказав, якщо вам цікаво зрозуміти більш основні поняття в імовірності та статистиці: "Від алгоритмів до Z-балів: ймовірнісні обчислення в статистиці" - це чудовий буквар для використання комп'ютерів для зрозуміти деякі найважливіші концепції початківців / проміжних в теорії ймовірностей та стохастичних процесах. Я також другий або "Вступ до статистичного навчання" або "Елементи статистичного навчання" (ESL) як вступ до машинного навчання (ML). Я думаю, що ESL, зокрема, є дивовижним, але він потребує набагато більшого математичного погляду на поняття ML, тому якщо ви лише вважаєте себе "добре" в статистиці, ви можете прочитати його, як тільки ви отримаєте більше досвід роботи з МЛ.

Якщо ви зацікавлені в машинному навчанні заради працевлаштування чи вирішення проблем, важливим є отримання практичного досвіду. Познайомтесь із курсами з інформатики / машинного навчання. Ендрю Нг робить дивовижне вступ до машинного навчання у своєму курсі тут . Я б також запропонував вам завантажити деякі набори даних і почати грати з ними. Якщо ви ще цього не зробили, скачайте R і RStudio (на мою думку, для початківців більш привітні, ніж Python або Matlab), і підпишіться на kaggle і зробіть деякі свої проблеми для початківців. У них є чудові покрокові інструкції, завдяки яким ви можете використовувати ML з принциповим уявленням про те, що відбувається насправді, але це дає вам уявлення про те, які кроки потрібно вжити, щоб реально реалізувати рішення ML.

Я особисто заохочував би комбінацію починати з використання інструментів ML, не знаючи, що вони роблять (використовуючи набори даних Kaggle чи подібні); та вивчення фундаментальних понять, таких як перехресне підтвердження, переоснащення, використання матриць плутанини, різні міри того, наскільки хороша модель і т. д. Мені набагато важливіше знати, як використовувати алгоритми та знати, як визначити, коли все працює. / не працюють, ніж зрозуміти, як працюють алгоритми.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.