Як зазначають Джиммі Лін та Кріс Дайер у першій главі книги " Інтенсивний обмін текстами з MapReduce" на великих масштабах даних, продуктивність різних алгоритмів сходяться таким чином, що відмінності в продуктивності практично зникають. Це означає, що, враховуючи достатньо великий набір даних, алгоритм, який ви хочете використовувати, є той, який обчислюється менш дорого. Відмінності в роботі між алгоритмами мають значення лише на менших масштабах даних.
Але , мабуть , їхня книга (зв'язана вище) та видобуток масивних наборів даних Ананда Раджарамана, Юре Лесковець та Джефрі Д. Уллмана - це, мабуть, дві книги, які ви хочете перевірити, особливо, якщо вони безпосередньо стосуються MapReduce для обміну даними.