Відповіді:
Якщо ви хочете, щоб книга, орієнтована на додатки, розгляньте моделювання машинного навчання Крістофера Бішопа . У нього більше технічних книг, які добре оцінені.
Якщо ви шукаєте багато коду, ймовірнісне програмування та байєсівські методи для хакерів - це варіант.
Ще одна вступна книга з більш статистичної Бент Введення статистичного навчання з додатками в R . Знову ж таки, автори мають добре розглянуту технічну версію книги.
У мене було таке ж питання кілька тижнів тому.
Я особисто вважав Python O'Reilly для аналізу даних дуже корисним у вивченні основ. У книзі передбачається, що у вас є певний досвід програмування python, але він також має додаток на задній панелі для ознайомлення з основами.
Автор наводить вам найрізноманітніші приклади реального світу (а не Монті Пітон) на початку, які ви можете створити протягом перших кількох розділів, а потім детально описує кожну річ, коли книга продовжується, будуючи свої знання.
Я знайшов інструкції дуже простими та покроковими. Мій професор, який є моїм путівником у всьому цьому, був вражений тим, як швидко я навчився.
Я також чула гарні речі про Kaggle.
Data Science in Cloud with Microsoft Azure Machine Learning and R - це безкоштовний підручник, який дуже детально працює на прикладі. Не відкладайте певні інструменти, які використовуються, оскільки вони вам не потрібні, щоб отримати певну користь з книги.
Ще один, який мені сподобався, - це програмування колективного інтелекту, який також детально проходить ряд проектів, включаючи веб-частину, що викреслює, яку більшість книг заглядають.
Я можу порекомендувати цю колекцію зошитів Ipython, яка включає зошити з коментарями щодо даних, статистики та машинного навчання.
https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks
Одне місце, де ви можете знайти цікаві покрокові пояснення, - це посібник Kaggle та інтерв'ю переможця . Часто люди публікують докладний підсумок свого підходу.
Однією з найкращих книг, з якими я потрапив, є машинне навчання на Python від Себастьяна Рашка. Прості приклади, поетапне пояснення та правильна кількість математики.
Структура книги охоплює весь процес від очищення даних до збирання та оцінки.
Подивіться на:
https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/
Це покроковий посібник, який дасть вам уявлення про весь процес дослідження даних, аналізу даних та побудови прогнозної моделі.
Пояснення щодо вивчення даних та інженерії функцій (як вибрати відповідні функції) знаходиться тут:
https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/
Дивіться перші 5 наборів даних тут, які мають навчальні посібники та працюють над ними, щоб отримати практичний досвід:
Подивіться також:
http://machinelearningmastery.com/machine-learning-in-python-step-by-step/
де він використовує кілька моделей на одному наборі даних, що дасть базове розуміння різних моделей.
Щоб дізнатися більше про вибір моделі, подивіться це:
https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection
Наведене вище посилання містить відповіді, які дають люди, які працюють у цій галузі.
Щоб отримати уявлення про різні набори даних, ви завжди можете увійти в команду та пройти змагання, а також ознайомитись із широким спектром наборів даних, де ви маєте доступ до коду людей у ядрах. Форуми в Kaggle корисні, оскільки люди обговорюють використання різних моделей для проблем та їх підходу.