Які кілька простих у вивченні програм машинного навчання? [зачинено]


12

Будучи новим у машинному навчанні взагалі, я хотів би почати грати і бачити, які можливості є.

Мені цікаво, які програми, які ви можете порекомендувати, могли запропонувати найшвидший час від встановлення до отримання значущого результату.

Також будь-які рекомендації щодо хороших матеріалів для початку роботи з теми машинного навчання взагалі були б вдячні.


На додаток до вивчення машинного навчання від Ендрю Нґ, ви можете спробувати деякі курси треку з підписом науки про дані в kaggle. про те, як зробити вибір функції, обмін даними та побудова кінцевої моделі в R та Python. kaggle.com/c/titanic/details/getting-started-with-python
0xF

Відповіді:


13

Я б рекомендував почати з деякого MOOC з машинного навчання. Наприклад, курс Ендрю Нґ на курсі .

Слід також ознайомитись із додатком Orange . Він має графічний інтерфейс, і, ймовірно, легше зрозуміти деякі методи ML, використовуючи його.


5
+1 За курс Ендрю Нґ. Це дуже добре зроблено.
TylerAndFriends

1
Джон Хопкінс також має трек сертифікатів щодо наукових даних (9 класів), який розпочався минулого тижня в Coursera. coursera.org/specialization/jhudatascience/… - це не все машинне навчання, але варто ділитися. Coursera сповнена дивовижності (а Ендрю Нг - чудовий лектор).
Стів Каллестад

11

Якщо чесно, я думаю, що виконання деяких проектів навчить вас набагато більше, ніж повний курс. Однією з причин є те, що виконання проекту є більш мотиваційним та відкритим, ніж виконання завдань.

Звичайно, якщо у вас є час І мотивація (реальна мотивація), краще, ніж робити проект. Інші коментатори зробили хороші рекомендації щодо технологій.

Я думаю, що з точки зору веселого проекту вам слід задати питання та придбати комп’ютер, щоб навчитися на нього відповідати.

Деякі хороші класичні запитання, які мають хороші приклади:

  • Нейронні мережі для розпізнавання рукописних цифр
  • Класифікація спам-електронної пошти за допомогою логістичної регресії
  • Класифікація об'єктів за допомогою гауссових моделей сумішей
  • Деяке використання лінійної регресії, можливо прогнозування цін на продуктові продукти за даними мікрорайонами

У цих проектах є математика, зроблено код, і їх можна легко знайти в Google.

Інші класні теми ви можете зробити самі!

Нарешті, я досліджу робототехніку, тому для мене більшість FUN-програм є поведінковими. Приклади можуть включати (якщо ви можете грати з ардуїно)

Створіть програму, яка, можливо, використовує логістичну регресію, яка дізнається, коли вимкнути і увімкнути вентилятор з урахуванням внутрішньої температури та стану світла в приміщенні.

Створіть додаток, який навчає робота переміщати привід, можливо колесо, на основі введення датчика (можливо натискання кнопки), використовуючи Gaussian Mixedure Models (навчання на демонстрації).

У будь-якому випадку, вони досить просунуті. Я висловлюю думку про те, що якщо ви виберете проект, який вам (дійсно справді) подобається, і витратите на нього кілька тижнів, ви навчитеся величезній кількості і зрозумієте набагато більше, ніж вам доведеться виконати кілька завдань.


5

Я думаю, що Weka - це хороша відправна точка. Ви можете виконати купу речей, таких як контрольоване навчання або кластеризація, і легко порівняти великий набір алгоритмів за методологіями.

Посібник Веки - це фактично книга про машинне навчання та обмін даними, яка може бути використана як вступний матеріал.


2

Припускаючи, що ви знайомі з програмуванням, я б рекомендував подивитися на scikit-learn . На ньому є особливо приємні сторінки довідки, які можуть слугувати міні-підручниками / швидкою екскурсією через машинне навчання. Оберіть цікаву для вас область та опрацюйте приклади.



2

Якщо ви вже знаєте R Studio, то пакет каретів - гарне місце для початку. Ось кілька навчальних посібників:

  1. https://class.coursera.org/predmachlearn-002
  2. http://caret.r-forge.r-project.org/index.html

За допомогою R та caret ви можете легко завантажувати та з’єднувати набори даних, зменшувати функції, аналізу основних компонентів та тренувати та прогнозувати, використовуючи різні алгоритми.


2

Якщо ви зможете відтворити сітку графіків розміром 6x3 з банера сторінки http://scikit-learn.org/, тоді ви дізналися деякі ML та деякі Python. Ви не згадали про мову. Python досить простий у навчанні дуже швидко, а scikit-learn має широкий спектр алгоритмів.

Тоді спробуйте власні дані!


1

На додаток до курсів та навчальних посібників, я б запропонував щось трохи більше « взяти на себе руки»: у Kaggle є кілька вступних змагань, які можуть викликати ваш інтерес (більшість людей починають із змагань «Титанік»). І існує велика кількість предметів, з яких слід вивчити та змагатись, коли хочеш отримати більше досвіду.


1

Як було сказано вище, відповіді розуміють основи ML, дотримуючись MOOCs проф. Андреу Нг та "Навчання з даних" професора Ясера Абу-Мостафи.

R - явний переможець як найбільш використовуваний інструмент у змаганнях з Kaggle. (Не забудьте перевірити ресурси на вікі та форумах Kaggle)

Вивчіть основні R та Python. Трек Coursera «Data Science» має вступний курс R . Майже всі алгоритми можна знайти в бібліотеках Python та R. Не соромтеся використовувати алгоритми, які ви вивчили в кількох змаганнях з кубок. В якості вихідної точки порівняйте продуктивність декількох алгоритмів на наборі даних Titanic та набору даних розпізнавача Digit на kaggle .

І продовжуйте практикувати різні набори даних!

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.