Як самостійно засвоїти наукові дані? [зачинено]


16

Я веб-розробник-самоучка і зацікавлений навчати себе науці даних, але я не знаю, як це почати. Зокрема, мені цікаво:

  1. Які поля є в науці про дані? (наприклад, Штучний інтелект, машинне навчання, аналіз даних тощо)
  2. Чи є онлайн-класи, які люди можуть порекомендувати?
  3. Чи є там проекти, над якими я можу практикувати (наприклад, відкриті набори даних).
  4. Чи є сертифікати, на які я можу подати заявку чи завершити її?

Відповіді:


15

Ласкаво просимо на сайт, Мартіне! Це досить широке запитання, тому ви, мабуть, отримаєте різноманітні відповіді. Ось мій взяти.

  1. Data Science - це міждисциплінарна сфера, яка, як правило, поєднує класичну статистику, машинне навчання та інформатику (знову ж, це залежить від того, кого ви запитуєте, але інші можуть включати сюди бізнес-розвідку, а також можливу візуалізацію інформації або відкриття знань; наприклад, стаття вікіпедії про науку про дані ). Хороший вчений даних також вміє підбирати специфічні для домену характеристики домену, в якому вони працюють. Наприклад, науковець, який працює над аналітикою для лікарняних записів, є набагато ефективнішим, якщо вони мають досвід в галузі біомедичної інформатики.
  2. Тут існує багато варіантів, залежно від типу аналітики, який вас цікавить. Курс курсу Ендрю Нґ - це перший ресурс, про який згадує більшість , і це правильно. Якщо ви зацікавлені в машинному навчанні, це прекрасне місце. Якщо ви хочете поглибити дослідження вивченої математики, "Елементи статистичного навчання" Тібширані - це відмінний, але досить просунутий текст. На додаток до НГ доступні безліч онлайн-курсів на курсах, але слід вибирати їх з урахуванням типу аналітики, на який ви хочете зосередитись, та / або домену, в якому плануєте працювати.
  3. Kaggle . Почніть з kaggle, якщо ви хочете зануритися в деякі проблеми аналітики в реальному світі. Залежно від вашого рівня знань, можливо, було б добре почати з простішого. Проект Euler - це чудовий ресурс для разових проблем з практикою, які я досі використовую як розминку.
  4. Знову ж таки, це, мабуть, залежить від домену, в якому ви хочете працювати. Однак, я знаю, що Coursera пропонує сертифікат з наукових даних, якщо ви пройдете серію курсів з наукових даних. Це, мабуть, гарне місце для початку.

Удачі! Якщо у вас є якісь інші конкретні питання, сміливо запитайте мене в коментарях, і я зроблю все можливе, щоб допомогти!


1
Повертаючись до цього, звичайно , Ендрю Нг є важко . Я повинен був сказати, що я не сильний у математиці. Я чув, що цей інший курс Data Science трохи простіше вивчити мотузки. Що ти думаєш?
Мартін

5

Я науковець з даних, і я намагаюся пояснити, як це зробити.


Які поля є в науці про дані? (наприклад, Штучний інтелект, машинне навчання, аналіз даних тощо)

Data Science - це дуже широка область. Йдеться про науку про дані. Отже, будь-яке поле, яке використовує дані для прийняття рішень, підпадає під цей домен. Деякі поля включають:

  • AI
  • Розпізнавання шаблонів та Analytics
  • Біо-статистика
  • Статистичне навчання
  • Машинне навчання
  • Естетика даних (або візуалізація даних)
  • Журналістика даних

Чи є онлайн-класи, які люди можуть порекомендувати?

Я відповів на подібне запитання . Тож я б процитував це тут:

Почніть з курсу машинного навчання Coursera . Це дійсно гарна робота по введенню студента в область машинного навчання і допомагає вам закласти міцну основу в концепціях.

У випадку, якщо ви відчуваєте, що математика трохи знижена в цьому курсі, ви можете взяти цей курс , викладений тим самим професором, і він є інтенсивним математикою, ніж попередній.

Тепер ви мали б чітку інтуїцію щодо основних понять машинного навчання. А тепер візьміть цей курс , який можна сказати як продовження або доповнення до курсу Ендрю Нґ.

Цей ресурс з IAPR містить детальні записки щодо багатьох концепцій ML, таких як перехресне підтвердження, регуляризація тощо.

Ви також можете ознайомитись із цим дивовижним списком ресурсів, зібраним у блозі на Quora.

Тепер, для занурення в передові концепції нейронних мереж та глибокого навчання, ви можете скористатися цією безкоштовною книгою .

Нарешті, безкоштовна електронна книга: Елементи статистичного навчання є чудовою книгою для початківців в ML або Статистичному навчанні.

На додачу до цього, перегляньте це сховище посилань на наукові дані від Quora .


Чи є там проекти, над якими я можу практикувати (наприклад, відкриті набори даних).

Я почав робити проекти з відкритими наборами даних Індії. Однак я б рекомендував вам перевірити цю дивовижну дискусію тут , і, зробивши ці проекти, ви можете почати з Kaggle.


Чи є сертифікати, на які я можу подати заявку чи завершити її?

На мою думку, немає ніяких сертифікатів науки про дані . Так, там є велика кількість сертифікатів великих даних, але я не бачив, що вони є дуже корисними для науковця, що починає працювати, тому рекомендую не переслідувати їх якнайшвидше, поки ви не будете достатньо впевнені у своїх навичках ML та даних.


1

Рекомендую починати зі спеціалізацій Coursera з наукових даних. Спеціалізація з наукових даних Джонса Хопкінса - найстаріша спеціалізація. Я не рекомендую книг і каглан. Вони вас бентежать лише на початку. Майте на увазі, що кодування - найпростіша частина науки про дані, і вам доведеться багато чому навчитися. Для отримання уявлення про поле ця діаграма Венна - хороший початок.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.