Намагання визначити, що найкраще для вас, насправді залежить від того, для чого ви його будете використовувати, кожен із них має свої переваги, і без жодних деталей це стає більше релігійною війною. Цій публікації, на яку ви посилалися, також більше року, і з тих пір обидва вони зазнали багатьох змін. Будь ласка, майте на увазі, я не знайомий з останніми розробками Кассандри.
Сказавши це, я перефразую комбінатара HBase Ендрю Пертелла і додам кілька власних вражень:
HBase знаходиться у великих виробничих середовищах (1000 вузлів), хоча це все ще знаходиться в основі встановлення ~ 400 вузлів Кассандри, так що це справді незначна різниця.
HBase і Cassandra підтримують реплікацію між кластерами / центрами обробки даних. Я вважаю, що HBase більше піддається користувачеві, тому це здається складнішим, але тоді ви також отримуєте більшу гнучкість.
Якщо вашій програмі потрібна сильна узгодженість, то HBase, швидше за все, краще підходить. Він розроблений з нуля, щоб бути послідовним. Наприклад, це дозволяє простішу реалізацію атомних лічильників (я думаю, що Кассандра щойно їх отримала), а також операції Check and Put.
Ефективність написання чудова, наскільки я розумію, це була одна з причин, чому Facebook погодився з HBase для свого месенджера.
Я не впевнений у поточному стані замовленого секціонера Кассандри, але раніше він вимагав ручного перебалансування. HBase обробляє це для вас, якщо хочете. Впорядкований розділ важливий для обробки стилю Hadoop.
Кассандра і HBase є складними, Кассандра просто краще приховує це. HBase виставляє це більше, використовуючи HDFS для його зберігання, якщо поглянути на кодову базу Кассандра така ж шарувата. Якщо порівняти документи "Динамо" та "Бігтабл", то можна побачити, що теорія дії Кассандри насправді є більш складною.
HBase має більше модульних тестів FWIW.
Весь Cassandra RPC є економним, HBase має Thrift, REST та рідну Java. Thrift та REST пропонують лише підмножину загального клієнтського API, але якщо ви хочете мати чисту швидкість, рідний клієнт Java є.
Є переваги як для однолітків, так і для господарів-рабів. Налаштування master - slave загалом полегшує налагодження та значно ускладнює.
HBase не прив'язаний лише до традиційного HDFS, ви можете змінити основне сховище залежно від ваших потреб. MapR виглядає досить цікаво, і я чув хороші речі, хоча сам не користувався ним.