Працюючи науковцем даних в одній з найбільших консультацій у світі, я можу просто дати свої два центи, один з яких корисний для такої роботи, як моя. Всі курси є класними та мають додатки як у дослідженні, розробці, так і в консалтингу. Однак деякі курси можуть бути важливішими для практичного застосування. Відмова: Це не відображає думку мого роботодавця, і я також бачив лише кілька департаментів у Німеччині.
НАЙБІЛЬШІ КУРСИ:
Якщо ви працюєте науковцем даних, ви обов'язково час від часу робите прогноз. Важливо, щоб ви розуміли такі моделі, як тенденції, коріння одиниць, сезонність тощо.
На практиці ви будете стикатися з даними з різними частотами, такими як щомісячні або щоквартальні дані.
Прочитайте принцип і практику прогнозування , щоб зрозуміти застосування прогнозування.
- Сучасне статистичне прогнозування та машинне навчання
Цей курс підвищить ваші шанси отримати високооплачувану роботу. Машинне навчання корелює з вищими зарплатами, ніж класична статистика. Однозначно варто знати такі речі, як дані про навчання та тести. Ви завжди будете будувати модель і тестувати її.
Через важливість машинного навчання ця сторінка називається CrossValidated. хахахаха
ТАКОЖ КОРИСНО:
- Лінійне моделювання: теорія та застосування
- Вступ до економетричного аналізу (перехресне зарахування статистики та Econ)
Ці курси здаються мені дуже схожими. Я припускаю, що обидва в основному мають справу з поздовжніми даними та даними Панелі. Однак більшість проблем з регресією, з якими ви зіткнетеся в якості даних вченого, що займається часовими рядами. У мене був лише один проект з моделюванням регресії Heckman modell / Tobit та деякими невеликими речами, де я зіткнувся з аналізом даних Count and Survival Analysis. Загальні завдання з класифікації в моїй компанії більш поширені, ніж регресійні.
Ви, швидше за все, працюєте в команді з математиками, статистиками та вченими-комп’ютерами. Вони не будуть дотримуватися економетричних моделей. Тим не менш, чітке розуміння лінійних моделей та економетричний аналіз допоможуть вам розібратися з часовими рядами та проблемами прогнозування.
Це також залежить від мови програмування, яку ви віддаєте перевагу. R (і навіть особливо Stata) дуже зручні для регресійних моделей. Python досить корисний для інших завдань.
Як уже заявив Майкл Черник, мікроекономічні питання широко застосовуються при страхуванні. Якщо ви працюєте у відділі страхування життя, аналіз виживання буде мати вирішальне значення. Однак більшість даних вченого не стикаються з такими завданнями.
Ви можете пройти цей застосований економетричний курс з курсу UCLA та задуматися над тим, як далеко ви зіткнетеся з подібними питаннями у своїй майбутній роботі.
РІДНИЙ ІРЕЛЕВАНТ:
- Стохастичні процеси (випадкові прогулянки, дискретні часові ланцюги Маркова, процеси Пуассона)
Це буде навряд чи корисним для Data Scientist. Можливо, ви можете зіткнутися з такими моделями, якщо працюєте у відділі кількісних фінансів банку.
Теорія ігор - теоретичне поняття, яке ледве безпосередньо застосовується на практиці. В економічних та психологічних дослідженнях це може бути корисним, однак це не в класичному масштабі науковця даних.
Будь ласка, не соромтеся запитати, чи варто мені бути більш конкретним щодо деяких курсів.