Я намагаюся зрозуміти, як всі компоненти "великих даних" грають разом у реальному випадку використання, наприклад, hadoop, monogodb / nosql, storm, kafka, ... Я знаю, що це досить широкий спектр інструментів, які використовуються для різних типів, але я хотів би дізнатися більше про їх взаємодію в додатках, наприклад, мислення машинного навчання для програми, webapp, інтернет-магазину.
У мене є вістори / сесія, дані про транзакції тощо і зберігаю це; але якщо я хочу робити рекомендації на ходу, я не можу запускати повільну карту / зменшувати завдання для цього у великій базі даних журналів, які у мене є. Де я можу дізнатися більше про інфраструктурні аспекти? Я думаю, що я можу використовувати більшість інструментів самостійно, але підключення їх один до одного здається мистецтвом.
Чи доступні загальнодоступні приклади / випадки використання тощо? Я розумію, що окремі трубопроводи сильно залежать від випадку використання та користувача, але саме приклади, ймовірно, будуть мені дуже корисні.