Мій друг припустив, що індустрії програмного забезпечення в першу чергу потрібні навички "великих даних", а не навички статистики самі по собі.
Частково погоджуючись з коментарем вашого друга, я хотів би зазначити, що в будь-якій галузі використовуються великі інструменти передачі даних, лише якщо всі V задоволені.
Я працюю керівником науки про дані у провідній компанії з підтримки клієнтів. Тут я роблю злом даних як для продукту, так і для зростання компанії.
Я в першу чергу використовую методи аналізу часових рядів для прогнозування часу та аналізу продажів. Сюди також входить поведінковий аналіз клієнтів, конкуренції та галузі.
Що стосується продукту, ми використовуємо цілий ряд методів, починаючи з аналізу настроїв, використовуючи LSTM, алгоритми рекомендацій тощо.
Але основна увага приділяється аналізу часових рядів. Загальний робочий процес буде таким:
- Очищення та формування даних.
- дослідницький та роз’яснювальний аналіз, який включає визначення сезонності, тенденцій та циклів. Отже, потрібно вивчити кореляції, автокореляції та кілька одновимірних та двоваріантних статистичних даних; разом із обширною графікою, включаючи криві розкиду, AFC, PAFC.
- Зараз приходить частина прогнозування, де різні моделі випробовують одна одну, серйозно враховуючи крок 2.
Інструменти, які використовуються мною: R, Python та Excel іноді.
І навіть поєднання наукових даних і хакерського зростання виявило магію в галузі маркетингу. Отже, попит на статистиків та математиків-духівників залишатиметься таким, яким є; і найближчим часом нікуди не занепаде; особливо коли стартують орієнтовані на клієнтів стартапи по всьому світу.