Кулінарна книга машинного навчання / довідкова карта / шпаргалка?


57

Мені здається, що такі ресурси, як « Вірогідність та статистика», та «Довідкова картка R» для обміну даними, є надзвичайно корисними. Вони, очевидно, добре слугують довідками, але також допомагають мені організувати свої думки на тему та отримати землю.

З: Чи існує щось подібне до цих ресурсів для методів машинного навчання?

Я уявляю собі довідкову карту, яка для кожного методу МЛ включала б:

  • Загальні властивості
  • Коли метод працює добре
  • Коли метод погано працює
  • Від яких або до яких інших методів узагальнюється метод. Це здебільшого замінено?
  • Семінарські роботи про метод
  • Відкриті проблеми, пов'язані з методом
  • Обчислювальна інтенсивність

Усі ці речі можна знайти при мінімальному копанні підручників, я впевнений. Просто було б дуже зручно розмістити їх на кількох сторінках.


5
Приємна мета, але «мінімальне копання через деякі підручники»? Як можна навіть почати стискати ці 20 книг для статистичного навчання та обміну даними + mloss.org/software/rating ?
denis


2
(+1) за чузпу, якби такий огляд існував, я б заплатив за це. Ключова проблема полягає в тому, що поряд з деякими властивостями, які можна було б отримати від самого алгоритму, більшість таких властивостей або правил великого пальця отримує досвід, тобто застосування. Я впевнений, що примусовий дослідник із загартованими в боях чи ML-рамках-програміст / консультант може написати щось подібне ... але тут і зараз?
steffen

@Denis: посилання "20 книг .." не працює, ви можете це перевірити?
lmsasu

6
Я не є експертом з машинного навчання, тому я буду відмовлятись від інших публікувати відповіді, але я вважаю, що Елементи статистичного навчання вважаються хорошим текстом на цю тему і написані одними з найбільших імен у цій галузі. Варто додати, що ця книга написана на високому рівні, і ті, кого я чув, рекомендують, щоб вони мали кандидатів зі статистики.
Макрос

Відповіді:


25

Одні з найкращих та вільно доступних ресурсів:

Щодо питання автора, я не зустрічав рішення "Все в одну сторінку"


Сергію, чи пов’язана книга Барбера з Матлабом?
denis

2
Так, просто подивіться на посилання на книгу: поле BRMLtool надається, щоб допомогти читачам побачити, як математичні моделі перетворюються на фактичний код MAT-LAB.
Сергій

31

Якщо ви хочете навчитися машинному навчанню, я настійно раджу записатись на безкоштовний онлайн-курс ML взимку, який викладає професор Андрій Нг .

Я робив попередній восени, і весь навчальний матеріал відрізняється винятковою якістю та орієнтований на практичне застосування, і набагато простіше шукати, що бореться наодинці з книгою.

Також зроблено досить низький висячий фрукт з хорошими інтуїтивними поясненнями та мінімальною кількістю математики.


Я щойно закінчив цей курс, і це приголомшливо! Крім того, це дозволило мені чудово почати розуміти книги з машинного навчання.
B Сім

1
Я думаю, що це посилання зараз є coursera.org/course/ml
n611x007

14

Так, у вас все добре; «Розпізнавання візерунків та машинне навчання» Крістофера Бішопа - це відмінна книга для загального ознайомлення, ви не можете в цьому помилитися.

Досить недавня книга, але також дуже добре написана і настільки ж широка, - « Байесівське розум і машинне навчання » Девіда Барбера ; Книга, яку я вважаю, трохи підходить для новачків у цій галузі.

Я використав "Елементи статистичного навчання" від Hastie et al. (згадується Макросом), і хоча це дуже сильна книга, я б не рекомендував це як перше посилання; можливо, це послужить вам краще як друга орієнтир для більш спеціалізованих тем. У цьому аспекті книга Девіда Маккея " Інформаційна теорія, умовиводи та алгоритми навчання" також може зробити чудову роботу.


2
+1 для єпископа. Чіткий розвиток з рівним рівнем деталізації. Хоча все ще добре, я завжди знаходив Хасті та ін. трішки похмурий.
кон'югатприор

1
+1 - Хасті, Тібширані та Фрідман - це мій особистий фаворит.
StasK

1
+1 теж для того, щоб рекомендувати Хасті, Тібширані та Фрідмана, моїх улюблених теж. І дякую за інші рекомендації; Я прочитаю їх, тому що мені справді потрібна хороша книга, яку рекомендуватимуть нестатистам (або особам, які щойно виходять на поле).
Нестор

1
+1 для єпископа. Насправді це чудове джерело і для класичної статистики, але оновлене та замасковане.
вигадки

10

Оскільки, здається, існує думка, що це питання не є дублікатом, я хотів би поділитися своїм улюбленим для початківців машинного навчання:

Я визнав програмування колективного інтелекту найпростішою книгою для початківців, оскільки автор Тобі Сегаран зосереджений на тому, щоб дозволити середньому розробнику програмного забезпечення забруднити руки якомога швидше зломлення даних.

Типовий розділ: Проблема даних чітко описується, після чого йде грубе пояснення того, як працює алгоритм і, нарешті, показано, як створити деяку інформацію з лише кількома рядками коду.

Використання python дозволяє зрозуміти все досить швидко (вам не потрібно знати python, серйозно, я не знав цього і раніше). НЕ думайте, що ця книга зосереджена лише на створенні системи рекомендацій. Він також має справу з видобуванням тексту / фільтрацією спаму / оптимізацією / кластеризацією / валідацією тощо.


6

Віттен і Френк, "Майнінг даних", Elsevier 2005 - це хороша книга для самонавчання, оскільки існує бібліотека Java з кодом (Weka), яка йде разом з книгою і дуже практично орієнтована. Я підозрюю, що є більш нове видання, ніж те, що я маю.


1
Так, ця книга повинна була називатися «Машинне навчання», але видавці змінили назву на «Майнінг даних» для того, щоб їхати на обробці даних, але все ж мова йде про ML, а не про DM (дві подібності, але це різні поля!).
clyfe

1
Книга Тома Мітчелла «Машинне навчання» також дуже гарна; стиль трохи старомодний, але зміст відмінний.
Дікран Марсупіал

Так, ML Тома Мітчелла - це як біблія ML, дійсно всебічна на місцях!
клаф


5

"Елементи статистичного навчання" були б чудовою книгою для ваших цілей. П'яте видання книги, яке було опубліковано на початку 2011 року, є у вільному доступі на веб- сайті http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf


2
це математика важкої книги, тому самостійному навчанню може бути важко наслідувати.
Атілла Озгур

Чи знаєте ви, як трапляється вільно завантажуватись на особистих сторінках Тревора Хасті, коли Спрінгер за це бере 70 доларів?
Альфред М.

Я точно не знаю, але я думаю, що Спрінгер хоче грошей, і автори в основному хочуть широко публікувати свою книгу. Це здається дуже схожим на те, як Springer продаватиме опубліковані вами статті, тоді як багато "версій робочого паперу" вільно доступні на веб-сайті автора.
DanB

FYI, завантаження призначене для 5-го друку другого видання. Я люблю виноску до епіграфа "В Бога ми довіряємо, всі інші приносять дані", які приписують Демінгу. Виноска вказує на іронію, що ніяких "даних" не може бути знайдено, що підтверджувало б Демінг насправді це говорив.
HeatfanJohn

Ви повинні згадати Вступ до статистичного навчання з R - це на зразок їх ESL -lite (якщо математика в ESL занадто непроста).
Стів S

5

введіть тут опис зображення

Часто найважчою частиною вирішення проблеми машинного навчання може бути пошук правильного оцінювача для роботи. Різні оцінки краще підходять для різних типів даних та різних проблем. Блок-схема наведена нижче призначена для того, щоб дати користувачам трохи орієнтовного керівництва щодо того, як підійти до проблем стосовно того, які оцінювачі використати ваші дані. Клацніть будь-який оцінювач у таблиці нижче, щоб побачити його документацію.



3

Більшість книг, згаданих в інших відповідях, дуже хороші, і ви не можете дійсно помилитися з жодною з них. Крім того, я вважаю, що наступний шпаргалка для Python є scikit-learnдосить корисною.


2

Мені подобаються Дуда, Харт та Лелека "Класифікація візерунків". Це нещодавній перегляд класичного тексту, який дуже добре пояснює все. Не впевнений, що він оновлюється, щоб мати велике покриття нейронних мереж та SVM. Книга Хасті, Тібширані та Фрідмана - про найкраще, але там може бути трохи більш технічним, ніж те, що ви шукаєте, і є детальним, а не оглядом теми.


2

Microsoft Azure також надає аналогічну шпаргалку до scikit-learn, яку розмістив Антон Тарасенко.

Чит-лист алгоритму машинного навчання Microsoft Azure

(джерело: https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet )

Вони супроводжують це повідомленням:

Пропозиції, запропоновані в цьому алгоритмі шпаргалки, є приблизними правилами. Деякі можуть бути зігнуті, а деякі - грубо порушеними. Це покликане запропонувати вихідну точку. (...)

Microsoft додатково надає вступну статтю, де надаються додаткові деталі.

Зауважте, що ці матеріали орієнтовані на методи, реалізовані в Microsoft Azure.


1

Не починайте з елементів статистичного навчання. Це чудово, але це довідник, який не схожий на те, що ви шукаєте. Я б почав із програмування колективного інтелекту, оскільки це легко прочитати.


Я не впевнений, що охарактеризував би ESL як опорний текст. Мені це здається більше оглядом, тобто ти не збираєшся вивчати тонкі зернисті деталі (навряд чи) нічого. Ви побачите широкі прийоми та загальні теми.
кардинал

1

Першу книгу про машинне навчання, яка непогано пояснює принципи, я настійно рекомендую

Роджерс і Джироламі, перший курс з машинного навчання (Чапман, Холл / Машинне навчання та розпізнавання образів), 2011 рік.

Книга Кріса Бішопа чи обох Девіда Барбера роблять хороший вибір для книги з більшою широтою, як тільки ви добре зрозумієте принципи.




0

Хороший шахрайський лист - той, який є в книзі Макса Куна « Прикладне прогнозування» . У книзі є хороша зведена таблиця з декількох моделей навчання МЛ. Таблиця в додатку A, сторінка 549.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.