Які "гарячі алгоритми" для машинного навчання?


14

Це наївне питання того, хто починає вивчати машинне навчання. Я читаю в наші дні книгу "Машинне навчання: алгоритмічна перспектива" від Marsland. Я вважаю це корисним як вступна книга, але зараз я хотів би перейти до вдосконалених алгоритмів, тих, які в даний час дають найкращі результати. Мене найбільше цікавить біоінформатика: кластеризація біологічних мереж та пошук закономірностей у біологічних послідовностях, особливо це стосується аналізу одномолекулярного поліморфізму (SNP). Чи можете ви порекомендувати мені кілька оглядів чи книжок для читання?

Відповіді:


15

Поглиблене навчання отримало велику увагу з 2006 року. Це, в основному, підхід до тренування глибоких нейронних мереж і призводить до дійсно вражаючих результатів на дуже жорстких наборах даних (наприклад, кластеризація документів або розпізнавання об'єктів). Деякі люди говорять про другий ренесанс нейронної мережі (наприклад, у цій розмові від Google Шмідхубер).

Якщо ви хочете вас вразити, варто переглянути цю наукову статтю Зменшення розмірності даних за допомогою нейронних мереж, Хінтона та Салахутдінова.

(Зараз у цій галузі триває стільки роботи, що я маю на увазі лише дві книги, які я знаю про це: широкомасштабне машинне навчання , Ленгфорд та ін. Та Машинне навчання: вірогідна перспектива Кевіна Мерфі.)

Якщо ви хочете дізнатися більше, ознайомтеся з тим, чим займаються основні групи глибокого навчання: Стенфорд , Монреаль та головне Торонто №1 та Торонто №2 .


8

Більшість наведених відповідей поки що стосуються "Наглядового навчання" (тобто, де у вас є мітки для частини вашого набору даних, які ви можете використовувати для тренування алгоритмів). У цьому питанні конкретно згадується кластеризація, яка є підходом "без нагляду" (тобто попередньо невідомі мітки відомі). У цьому сценарії я б запропонував переглянути:

  • k-означає і ядро ​​k-означає
  • Агломераційна кластеризація
  • Негативна матрична факторизація
  • Латентне виділення Діріхле
  • Діріхлетові процеси та ієрархічні процеси Діріхле

Але насправді ви напевно виявите, що ваша міра подібності / відстані важливіша за конкретний алгоритм, який ви використовуєте.

Якщо у вас є кілька мічених даних, то підходи "Навчальне навчання" набувають все більшої популярності і можуть бути дуже потужними. Гарною відправною точкою для SSL є LapSVM (Laplacian Support Vector Machine).


7

Це книги, які можуть бути корисними:

  • Вступ до обміну даними Панг-Нін Тан, Майкл Штейнбах, Віпін Кумар. Це була запропонована книга під час моїх занять з вивчення даних в університеті. Мені подобається його компонування та теоретичний підхід;
  • Обмін даними: практичні інструменти та методи машинного навчання Ian H. Witten, Eibe Frank, Mark A. Hall. Дуже цікава книга. Ця книга охоплює також безліч реалізованих методів з Data Mining Framework WEKA ;
  • Машинне навчання Томаса Мітчелла. Це трохи стара книга, але вона може бути корисною.

Тоді пам’ятайте, що ви можете відвідувати безкоштовні уроки машинного навчання в Стенфорді щойно розпочаті: www.ml-class.com .

А для вашої конкретної проблеми - аналізу SNP, я б запропонував ознайомитися з групою Ді Камілло в Падуському університеті.


5

Ось чудова стаття та книга, яка пояснює обґрунтування, теорію та застосування більшості найпопулярніших методів:

Топ-10 алгоритмів в обміні даних

Це особливо акуратно, оскільки це "топ-10", обране експертами в цій галузі.

Крім того, для даних про гени в цілому вибір особливостей є надзвичайно важливим через безліч особливостей. Наприклад, рекурсивне усунення ознак SVM (SVM-RFE) та пов'язані з ними методи дуже популярні та активно розробляються та застосовуються в контексті даних про ген.


4

Підвищені дерева та певна форма svm виграють багато змагань, але це завжди зводиться до контексту. Регулялізація колектора також є на передній частині.


4

Я рекомендую "Елементи статистичного навчання" Хасті, Тібшірані та Фрідмана. Не просто читайте, пограйте з деякими описаними ними алгоритмами (більшість з них реалізовані в R, або ви можете навіть реалізувати деякі самостійно), і вивчіть їх слабкі та сильні моменти.



3

Гауссові процеси для машинного навчання Расмуссена та Вільямса (MIT Press) є обов'язковими. Гауссові процеси є одним із найактивніших алгоритмів машинного навчання тепер, коли доступні розповсюдження очікування та алгоритми варіативних висновків. Книга дуже добре написана, має безкоштовний набір інструментів MATLAB (хороший біт набору), і книгу можна завантажити безкоштовно.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.