SQL дозволяє зберігати та робити безліч різних трансакцій відносин і завжди мати їх доступними для різних цілей. По суті, одне джерело істини або місце, куди слід піти. Там над головою точно. Однак деякі аналізи можуть бути дуже складними і вимагають значної кількості операцій на основі встановлених даних, що може дуже швидко перетворити навіть невеликий набір даних у великий. У мене були процеси обробки даних, які мають понад 2000 запитів, які обробляють терабайти менше ніж за 5 хвилин і можуть набрати мільярди записів для прогнозованої моделі в кінці, а python і numpy набрали частину набору даних у 10 разів як реляційний сховище даних та подавати його до рівня презентації.
Додатковий момент, якщо робити це в хмарі, переконайтеся, що у вас є динамічний екземпляр, який може масштабувати його пам'ять. У SQL справа в тому, щоб мати диск і достатньо обчислити, щоб це вчасно зробити.
Я бачу багато способів, як вони можуть працювати в синергії. Багато завдань, що займаються науковою інформацією, - це те, що Pandas був розроблений. Деякі завдання з науково-технічних даних - це те, що були розроблені RDB. Використовуйте обидва в балансі.
Вся справа в правильному інструменті, щоб виконати правильну роботу.