Це дійсно залежить від того, що ви намагаєтеся зробити, і що ви маєте на увазі під "Кластер розподілених обчислень". Я робив подібну річ одного разу в Uni, використовуючи старі машини та PVM , це "Кластер" у розумінні купи машин, що діють як один комп'ютер для паралельної обробки - думаю, кластери Beowulf. Звичайно, вам знадобиться код, написаний, щоб скористатися цим.
Хорошим місцем для початку було б визначити, що ви шукаєте, щоб навчитися за допомогою цього проекту. Я рекомендую для початку прочитати статтю вікіпедії про паралельні обчислення , а потім уточнити свої потреби на основі того, що ви хочете зробити.
Для швидкого отримання якісних результатів може бути достатньо простої системи черги на роботу (як-от редуктор ).
Проблема, яку я мав, коли я робив паралельний обчислювальний кластер, чи не мав я на цьому нічого робити, він просто сидів там, але це був цікавий проект, і я навчився зовсім небагато. У будь-якому випадку, ви, швидше за все, навчитеся трохи і одночасно розважаєтесь, незалежно від того, що ви вирішите застосувати.
Що стосується вибору дистрибутивів, я б підходив до того, що мені найбільше подобалося, оскільки вам, ймовірно, потрібно буде встановлювати речі з джерела. Після того, як вам зручно налаштувати все, ви зможете розібратися у пошуку дистрибутива, який підходить більше до ваших потреб. Але будь-який розподіл повинен робити.
Яке програмне забезпечення для налаштування кластера? Це повністю залежить від того, який тип кластеру ви створюєте.
На борту проти розподіленого FS? Знову ж таки, це залежить від вимог до вашого кластеру. Чи буде кожен вузол передавати дані туди-сюди серед інших вузлів? Чи будуть вони діяти як раби з єдиним господарем? чи оперуватимуть вони абсолютно незалежно? Ці питання почнуть інформувати ваш вибір. І звичайно, завжди є компроміси.
Деякі інші посилання, які можуть виявитись цікавими:
http://hadoop.apache.org/
http://www.csm.ornl.gov/oscar/
https://computing.llnl.gov/tutorials/parallel_comp/
http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environments/
http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/