У багатьох ситуаціях із реального життя, коли ви застосовуєте MapReduce, остаточні алгоритми в кінцевому підсумку становлять кілька кроків MapReduce.
тобто Map1, Reduce1, Map2, Reduce2 тощо.
Таким чином, у вас є вихід з останнього зменшення, яке потрібне як вхід для наступної карти.
Проміжні дані - це те, чого ви (загалом) не хочете зберігати, коли трубопровід буде успішно завершений. Крім того, оскільки ці проміжні дані взагалі є деякою структурою даних (наприклад, "карта" або "набір"), ви не хочете докладати великих зусиль для написання та читання цих пар ключових значень.
Який рекомендований спосіб зробити це в Hadoop?
Чи є (простий) приклад, який показує, як правильно обробляти ці проміжні дані, включаючи очищення після цього?