Ви використовуєте Apache Kafka як розподілену і надійну чергу, яка може обробляти дані з великим обсягом і дозволяє передавати повідомлення з однієї кінцевої точки в іншу.
Буря - не черга. Це система, яка поширює можливості обробки в режимі реального часу, тобто ви можете паралельно виконувати всілякі маніпуляції над даними в реальному часі.
Загальний потік цих інструментів (наскільки я це знаю) полягає в наступному:
система в режимі реального часу -> Kafka -> Storm -> NoSql -> BI (необов'язково)
Отже, у вас в реальному часі додаток, що обробляє дані з великим обсягом, надсилає їх у чергу Kafka. Буря витягує дані з кафки і застосовує деякі необхідні маніпуляції. У цей момент вам зазвичай подобається отримати певні переваги від цих даних, тому ви або надішліть їх в якийсь Nosql db для додаткових обчислень BI, або ви можете просто запитати цей NoSql з будь-якої іншої системи.