Я зараз готуюсь викладати вступний курс з наукових даних з використанням мови програмування R. Моя аудиторія - студенти, що спеціалізуються на бізнес-предметах. Типовий недорогий бізнес не має досвіду комп'ютерного програмування, але він взяв кілька класів, які використовують Excel.
Особисто мені дуже зручно користуватися R (або іншими мовами програмування), тому що я поцікавився інформатикою. Однак у мене є відчуття, що багато моїх студентів будуть насторожено вивчати мову програмування, оскільки це може здатися їм важким.
У мене є деякі знайомі з Excel, і я вважаю, що, хоча Excel може бути корисним для простої науки про дані, студентам необхідно вивчити серйозну мову програмування для даних даних (наприклад, R або Python). Як я переконаю себе і студентів, що Excel недостатній для серйозного бізнес-студента, який вивчає дані даних, і що їм потрібно навчитися деякому програмуванню?
Відредаговано у відповідь на коментар
Ось деякі теми, які я висвітлюю:
- Обробка та очищення даних
- Як маніпулювати таблицею даних, наприклад, вибрати підмножину рядків (фільтр), додати нові змінні (мутувати), сортувати рядки за стовпцями
- SQL приєднується за допомогою пакету dplyr
- Як намалювати графіки (розкидати графіки, діаграми , гістограми тощо), використовуючи пакет ggplot2
- Як оцінити та інтерпретувати статистичні моделі, такі як лінійна регресія, логістична регресія, класифікаційні дерева та k-найближчі сусіди
Оскільки я не дуже добре знаю Excel, я не знаю, чи всі ці завдання можна легко виконати в Excel.