Що ви думаєте про сертифікати Data Science?


35

Зараз я бачив дві програми сертифікації наукових даних - Джон Хопкінс, один із Coursera та Cloudera .

Я впевнений, що там є й інші.

Набір класів Джона Хопкінса орієнтований на R як набір інструментів, але охоплює низку тем:

  • R Програмування
  • очищення та отримання даних
  • Аналіз даних
  • Відтворювані дослідження
  • Статистичний висновок
  • Регресійні моделі
  • Машинне навчання
  • Розробка продуктів даних
  • І, як виглядає, завдання на завершення, засноване на проекті, схоже на виклик Cloudera Data Science Challenge

Програма Cloudera виглядає тонкою на поверхні, але шукає відповіді на два важливі питання - «Чи знаєте ви інструменти», «Чи можете ви застосувати інструменти в реальному світі». Їх програма складається з:

  • Вступ до наукових даних
  • Екзамен з наукових основ даних
  • Data Science Challenge (реальний сценарій проекту наукових даних про дані)

Я не шукаю рекомендації щодо програми чи порівняння якості.

Мені цікаво про інші сертифікати там, тематику, яку вони охоплюють, і наскільки серйозно сертифікати DS розглядаються на даний момент громадою.

РЕДАКТУВАННЯ: Це все чудові відповіді. Я вибираю правильну відповідь голосами.


4
Це занадто широко і в першу чергу ґрунтується на думках. Погляньте на datascience.stackexchange.com/help/dont-ask
asheeshr

3
@AsheeshR - ми в середньому по 2 питання на день і 2 відповіді на питання. У цей момент слід зосередити увагу на заохоченні участі та підвищенні інтересу.
Стів Каллестад

10
Залучення за рахунок якості сайту не є рішенням. Заручини минущі. Якість набагато складніше змінити згодом.
asheeshr

4
Велосипеди , робоче місце , особисті фінанси та гроші , скептики , розробка ігор - все, що починається з менш ніж 10 питань на день. Велосипеди були запущені з 4 на день, оскільки він вважався високоякісним сайтом.
asheeshr

3
Ну ... я думаю, що я маю оголосити вас переможцем у цей момент. :)
Стів Каллестад

Відповіді:


13

Я зробив перші два курси, і всі інші теж планую робити. Якщо ви не знаєте R, це дійсно гарна програма. Щотижня проводяться завдання та вікторини. Багато людей вважають деякі курси дуже важкими. Вам буде важко, якщо у вас немає досвіду програмування (навіть якщо вони кажуть, що це не потрібно).

Пам'ятайте .. це не тому, що ви можете керувати автомобілем, що ви пілот F1;)


32

Як колишній менеджер з аналітики та нинішній науковий співробітник, я дуже цікавлюсь необхідністю отримання сертифікатів з наукових даних. Термін "вчений даних" є досить розпливчастим, і область наукових даних знаходиться в зародковому стані. Сертифікат передбачає якийсь єдиний стандарт, якого просто не вистачає науці даних, це все ще дуже дикий захід.

Хоча сертифікат, ймовірно, не зашкодить вам, я думаю, ваш час було б краще витратити на розвиток досвіду, щоб знати, коли використовувати певний підхід, і глибину розуміння, щоб можна було пояснити такий підхід нетехнічній аудиторії.


2
Іноді досвід набути важко, якщо ваша нинішня робота не зосереджена на науці даних, а на якійсь суміжній галузі (в моєму випадку - статистиці). Я використовую курси, щоб здобути певні знання та зупинитися на темі, чого я не можу виконати в денній роботі.
Крістіан Зауер

1
Я повністю погоджуюсь, курси дуже цінні, що дають тобі вихідну точку та певну структуру для набуття цього досвіду. Щоб отримати максимальну користь від Mooc, я пропоную дуже конкретний приклад, скажімо, логістична регресія та реальна робота з нею з іншим набором даних, подвійний бонус, якщо ви робите це мовою, відмінною від тієї, на якій викладається курс .
neone4373

Це хороша ідея. Те, що бракує статистиці загалом, - це навчальний веб-сайт. Наприклад, набір баз даних, а також цілі та можливі результати в кінці. Щось на кшталт khancademy, але більш потужне;)
Крістіан Зауер

11

Програми сертифікації, які ви згадали, - це справді курси початкового рівня. Особисто я вважаю, що ці сертифікати показують лише наполегливість людини, і вони можуть бути корисними лише тим, хто претендує на стажування, а не на реальні робочі місця з наукових даних.


Я згоден. Матеріал курсу добре для початку роботи, але це переважно початковий рівень.
Шагун Содхані

10

Я очолюю науково-дослідні команди для великої інтернет-компанії, і провів сотні профілів та опитав десятки для наших команд у всьому світі. Багато кандидатів пройшли вищезгадані курси та програми або принесли подібні документи. Особисто я також брав курси, деякі хороші, інші невтішні, але жоден з них не робить вас "науковцем даних".

Загалом, я згоден з іншими тут. Сертифікат від Coursera або Cloudera просто сигналізує про зацікавленість, але голку не рухає. Існує ще багато, що слід розглянути, і ви можете мати більший вплив, надаючи всебічне сховище вашої роботи (наприклад, профіль github) та здійснюючи мережу з іншими науковцями даних. Кожен, хто приймає на роботу для профілю даних, завжди бажає побачити вашу попередню роботу та стиль / здібності кодування.


8

Існує кілька сертифікатів, але вони мають різну зону фокусу та стиль викладання.

Я більше віддаю перевагу The Analytics Edge на eDX порівняно зі спеціалізацією Джона Хопкінса, оскільки він більш інтенсивний та практичний. Очікується, що спеціалізація Джона Хопкінса - тривати 3-4 години на тиждень проти 11 - 12 годин на тиждень на Analytics Edge.

З галузевої точки зору, я приймаю ці сертифікати як ознаку інтересу, а не рівня знань, якими володіє людина. У цих MOOC занадто багато відмов. Я ціную інший досвід (наприклад, участь у змаганнях Kaggle) набагато більше, ніж проходження сертифікації XYZ на MOOC.


2
А як статистика.SE, профілі datascience.SE. Як ви думаєте, вони можуть сказати багато про відповідний рівень знань?
IharS

Які стосунки до цього мають? Імовірно, сертифікація залежить від закінчення курсу, а не просто реєстрації…
Гала

Є багато людей, які згадують, що проходять сертифікацію, проходячи курс на цих MOOC. З цим потрібно бути обережним.
Кунал

@Kunal Це має сенс, але ваша відповідь переходить від "сертифікації" до "відміни" (які, мабуть , не мають сертифікації ). Ключ тут проходить . Це трохи схоже на те, щоб бути зареєстрованим студентом або мати обліковий запис Kaggle. Ніщо з цього не говорить нам, чи варто цінувати того, хто насправді здобув наукову ступінь, закінчив курс чи брав участь у конкурсі до кінця.
Гала

6

Не впевнений у першій хмарній епосі, але один з моїх друзів приєднався до Джона Хопкінса, і, за його словами, це "чудово, щоб почати". Його також рекомендували багато людей. Я планую приєднатися до нього через кілька тижнів. Що стосується серйозності, я не думаю, що ці сертифікати допоможуть вам влаштуватися на роботу, але вони точно допоможуть вам навчитися.


4

@OP: Вибір відповідей голосами - НАРОДНА ідея.

Ваше питання стає популярним конкурсом. Ви повинні шукати правильну відповідь, я сумніваюся, ви знаєте, про що ви питаєте, знаєте, що шукаєте.

Щоб відповісти на ваше запитання:
Питання: як серйозно на цей момент суспільство сприймає сертифікати DS.

A: Яка ваша мета від проходження цих курсів? Для роботи, для школи, для самовдосконалення тощо? Заняття курсами дуже застосовуються, теорії ви не навчитеся багато, вони навмисно зарезервовані для уроків.

Тим не менш, уроки Курсера дуже корисні. Я б сказав, що це еквівалентно одному курсу класу статистів, з дворічної магістерської програми.

Я ще не впевнений у її галузевому визнанні, бо проблема, як ти насправді пройшов курс? Скільки часу ви витратили? Набагато легше отримати A на цих курсах, ніж аудиторний екзамен з паперу-олівця. Отже, існує величезна різниця в якості від людини до людини.


Частина питання має на меті визначити, чи надає громада цінність сертифікації. У деяких сферах сертифікація є абсолютно необхідною. В інших сертифікація зовсім не має значення. В іншому випадку, сертифікати певної компанії проводяться з повагою, а конкурентні сертифікати - ні. Інша частина мала на меті зрозуміти різницю в актуальному фокусі сертифікатів, які там знаходяться. Data Science - широкий термін. Сертифікати зазвичай більш цілеспрямовані. Це невдале запитання для формату QA - це більше дискусія, залежність від думки.
Стів Каллестад

Моє призначення зазначити, що я вибрав відповідь голосами, було зрозуміти, що всі відповіді заслуговують на прочитання. Усі заробляють хороші бали, в тому числі і ви внизу тут. Хтось, хто цікавиться цими речами, не повинен обмежуватись лише однією чи двома відповідями.
Стів Каллестад

Голосування за пошук правильної відповіді - жахлива ідея. Це неправильний підхід до математики. Ви явно пропустили мою думку.
user13985

2

Я думаю, що ефект від атестації від курсів залежить як від особистості, так і від занять. Ця вимога говорить про мінімум 3-5 годин на тиждень, якщо ви вкладаєте більше, а матеріал відкривається набагато більше, ніж 3-5 годин, то ці заняття та сертифікати можуть бути еквівалентними міцній базі знань та досвіду в цій галузі . Наука приходить до тих, хто цього вимагає.


2

Я майже закінчуюсь спеціалізацією з наукових даних Джонса Хопкінса з курсу Coursera (Курс і головний камінь, що залишився для випускника). Я просто дам вам плюси і мінуси, намагаючись дотримати це максимально об'єктивно:

Плюси :

  • Структура навколо навчального процесу
  • Ви будете створювати портфоліо з часом

Мінуси :

  • Для різних курсів необхідні різні знання. Перші кілька курсів не передбачають попередніх знань. Це раптом стає непросто зрозуміти на концептуальних курсах. (Статистичні умовиводи, регресійний аналіз)
  • Викладали 3 професора. Я думаю, що вони не на одній сторінці про свою потенційну аудиторію та свої здібності / потреби / інтереси.

2

Найкращий спосіб досягти успіху в отриманні роботи, яку ви хочете, щоб вона показала, що ви можете це зробити.

Згадані вами MOOC дадуть вам хорошу основу в основах і повинні бути достатніми для того, щоб ви почали вирішувати власні проблеми машинного навчання / науки про дані. Спробуйте змагання з Kaggle або два, це відмінний спосіб поліпшити свої навички, і гідний бал там зацікавить потенційного роботодавця. Опублікуйте свої результати на Github, використовуючи щось на зразок ноутбука iPython, що дозволить легко побачити та оцінити вашу роботу.

Спробуйте аналіз інших публічних наборів даних, наприклад, набору даних для спільного використання велосипедів UCI або набору даних для лікування діабету UCI - це дуже цікаво спробувати, і покажіть, що ви прагнете і бажаєте розвивати свої навички.


2

Це дійсно залежить від надійності установи, яка надає сертифікат. Наприклад, сертифікація даних про науку від компанії, що базується в Гарварді, визнана багатьма галузевими партнерами і може зробити хороший вибір. Ви не сказали, який сертифікат шукаєте?


1

Цінність для студента, мішана сумка. Платити кілька сотень доларів за програму або сто попсових за курс - мотивація.

Я завершив одну серію, від MITx. Це випускний курс опитування методів та інструментів, спрямованих на тих, хто потребує "детального знання". Досить заземлення, щоб я почував себе комфортно, застосовуючи те, що навчився.

Автономний курс HarvardX по методу спрямованого ациклічного графіка був більше схожий на випускний семінар зі статистики за методом Джудея Перл. Минуло б давно, коли б я про це почула, інакше.

Серія HarvardX - це завантажувальний табір для випускників рівня, спрямований на орієнтацію нового студента на набір інструментів і програм R.

Серія BerkeleyX - це ступінь бакалаврського опитування з використанням спеціального класу Python, що майже не відповідає доменній мові.

Щодо вартості сертифікатів, я можу лише повідомити, що єдиним моїм навчальним досвідом був магістр геофізики, і я мав близько року платного досвіду поза посадовою інструкцією (старший юрист банку).

Можливо, в результаті сертифікатів мене відхилили як "некваліфікованого" щонайменше для двох робіт, про які я знаю. Отже, моя порада полягає в тому, що якщо у вас є сертифікат, не згадуйте про нього, якщо слово "Excel" відображається в роботі.


1

Деякі ресурси на edX для курсів з даних з Гарварду, MIT, Microsoft та інших, які можуть зацікавити цю групу.

Наприклад, у нас є професійна програма сертифіката від Гарварда , що складається з 8 курсів і дипломний іспит тут .

Для більш просунутих досліджень, у нас є програма MicroMasters з MIT тут .

а також один з UC San Diego тут . Для чудового огляду даних Data Science, у нас є програма від Microsoft. Про всі наші програми ви можете ознайомитись тут .

Сподіваюся, це допомагає,

Джош від edX

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.