Я не можу сказати з вашого запитання, наскільки ви вмілі в математиці чи де зупиняється навчання. Я припускаю, оскільки ви інженер програмного забезпечення комп’ютера, що ви знайомі з алгеброю, геометрією та, можливо, деяким підрахунком.
Я рекомендую розпочати навчання, читаючи статистику та розуміючи такі поняття, як описи, дослідницький аналіз даних, кореляція, розподіл тощо. Я бачу, що ви віддаєте перевагу книгам, а не відео, тому я зустріну вас на півдорозі та надаю вам декілька книг, які є в Інтернеті, а також книгу чи дві, які ви можете придбати друком.
По-перше, я б порекомендував онлайн-програму онлайн-випускників Пенн-Штату зі статистики . Ви можете вивчити кожен їх курс за допомогою меню зліва. Вибравши курс, прокрутіть вниз на веб-сторінці курсу та натисніть на посилання, що говорить про "записки онлайн-курсу". Конспекти курсів для цих курсів набагато більше, ніж конспекти і читаються як повноцінні книги. Вони дуже повчальні. Крім того, ознайомтесь із навчальною програмою онлайн-програми для бакалавратів Пенні Штату зі статистики , якщо ви знайдете у випускній курсі щось занадто розвинене та хочете "простішого" пояснення.
По-друге, перегляньте Посібник з біологічної статистики Джона Х. Макдональда. Не дозволяйте заголовку вас обдурити; ця книга є чудовим букварем із статистики та аналізу даних, який застосовний до будь-якої галузі.
По-третє, перегляньте Маленький посібник зі статистики Джерара Даллала. Знову ж, не дозволяйте заголовку вас обдурити; ця книга є ще одним дорогоцінним каменем, який провадить вас через деякі важливі основи статистики.
По-четверте, ознайомтеся з книгою « Мислити статистику » Аллена Дауні. Є в Інтернеті безкоштовна версія попереднього видання; останнє видання, яке вам доведеться придбати. Але це варто, особливо якщо ви працюєте в Python. У цій книзі автор навчає вас статистиці та аналізу даних за допомогою Python для аналізу реальних наборів даних (іграшок). Це справді чудова книга, над якою можна працювати.
Нарешті, перегляньте дані Data from Scratch Джоела Груса. Ця книга більше приділяється аналізу даних (замість основ статистики) і приділяє більше уваги машинному навчанню та моделюванню. Він використовує Python (і стек наукових даних Python), щоб провести вас шляхом аналізу та проведення прогнозної аналітики на реальних наборах даних (іграшок). Ще одна чудова книга, яку можна переробити.