Я знайшов проект Euler http://projecteuler.net/ неймовірно корисним у вивченні мов програмування. Чи є подібний сайт для машинного навчання?
Я бачив http://www.kaggle.com/ , але він не настільки доступний для початківців, як Project Euler.
Я знайшов проект Euler http://projecteuler.net/ неймовірно корисним у вивченні мов програмування. Чи є подібний сайт для машинного навчання?
Я бачив http://www.kaggle.com/ , але він не настільки доступний для початківців, як Project Euler.
Відповіді:
Хоча ставки вищі, ніж у Project Euler, як ви зазначили, Kaggle є чудовим джерелом даних для використання у ваших власних експериментах. Багато їхніх конкурсів вимагають підписатись для доступу до наборів даних (для юридичних угод тощо), але якщо ви фактично не закінчите запис, я не знаю жодного штрафу.
Це означає, що якщо ви шукаєте набори даних, характерні для процедур тестування статистики, як, наприклад, у Принстоні , ви можете протестувати дані в різних архітектурах мережі та порівняти їх із звичайною регресією тощо.
Дивіться також тут для вичерпного списку, який включає всі дані з обробки природних мов Google .
Так, Project Euler надає чудову послугу з конкретними проблемами, але у випадку машинного навчання ви можете використовувати наявні набори даних з архітектурою вашого створення та порівнювати "відповіді" на висновки, які представлені в Інтернеті або в наукових роботах.
UCI добре відомий у спільноті машинного навчання своїм сховищем, якщо набори даних. Багато статей журналу містять результати своїх методик на деяких наборах даних UCI, тож ви можете спробувати себе і подивитися, як вам це зробити.
Як щодо: http://www.ml-class.org/ ? Він має гарне введення та деякі вищі програми програмування. AFAIK Euler має набагато складніші приклади, але клас ml все ще є гарним початком.
Як було зазначено в коментарях, цей курс має наступне видання: http://jan2012.ml-class.org/#