Коли побудувати кластер у хмарі дешевше, ніж побудувати його в моїй лабораторії для моделювання MD?


23

Обчислювальний кластер Amazon EC2 коштує приблизно від 800 до 1000 доларів (залежно від робочого циклу) на фізичне ядро ​​процесора протягом 3 років. Під час нашого останнього раунду з придбання обладнання моя лабораторія зібрала обладнання з 48 ядер, що дуже схоже на кластери Amazon, приблизно за $ 300 доларів.

Я чогось тут пропускаю? Чи є ситуації, в яких є економічним сенсом будувати кластер у хмарі для завдань з високим процесором, таких як моделювання молекулярної динаміки? Або мені завжди краще просто будувати та нести дитину машину для дачі?

(Я мушу зазначити, що моя лабораторія не платить за електроенергію в нашому серверному залі (принаймні не безпосередньо), але навіть з цією вигодою Amazon все ще здається надзвичайно дорогим).


2
Я можу вам сказати, що вам не вистачає певних витрат на оплату праці для адміністрування та обслуговування кластерів. В академічній обстановці хтось повинен бути адміністратором кластера і виконувати всю бурхливу роботу, як-от оновлення та оновлення системи ОС, встановлення нового програмного забезпечення, технічна підтримка, коли кластер знижується тощо. Ці завдання невдячні, і залежно від кваліфікації адміністратора можуть зажадати багато часу. Кластер EC2 скоротить робочі години, необхідні для обслуговування кластеру.
Джефф Оксберрі

1
Ну, ви, очевидно, апаратно придбали дешево. Я підрахував витрати на кластер 192-ядерних місць на моєму колишньому робочому місці за три роки, і виявилося, що це понад 850 доларів за ядро ​​на рік. Не кажучи вже про всі проблеми, які у нас були з енергосистемою та охолодженням ...
Христо Ілієв

@GeoffOxberry Ви добре зазначаєте про витрати на працю. У моїй лабораторії я адміністратор, тому я не думаю про такі речі. Як неприємно, як це буває іноді, це праця любові. Якби у мене були готівки і десь їх покласти, я б дотримувався (рідкісних) інструкцій у цьому блозі і намагався створити власний Ватсон.
тел

@HristoIliev Я навіть не думаю, що це було так дешево. Якщо ви готові скористатися кластерами, що «злегка використовуються», від Dell, ви можете знизити вартість до 200 доларів за основу. Чи можете ви розповісти більше про обладнання на колишньому робочому місці?
тел

1
Це спеціально вбудована система з 12-ти розрядними шасі Xeon з двома роз'ємами Supermicro (24 вузли, 48 E5420s) з 16 гігабайтовою оперативною пам’яттю на кожному вузлі, однією однорозетною машиною Nehalem з 2 Tesla M2090s, 24-портовим комутатором InfiniBand, одним файловий сервер з 4 дисками, двома ДБЖ 10 кВА, двома кондиціонерами. Ми отримували його в кілька етапів протягом трирічного періоду проекту. Не найбільший із найбільших, але все ж ~ 100 тис. Євро загалом (найкращі академічні ціни в Болгарії).
Христо Ілієв

Відповіді:


15

На мою думку, головна перевага використання хмарних ресурсів - це гнучкість, тобто якщо у вас коливання робочого навантаження, ви платите лише за те, що вам потрібно.

Якщо це не так у вашій заявці, тобто ви знаєте, що у вас буде кількісно виміряна і постійна навантаження, ви, ймовірно, краще будуєте свій власний кластер. У Хмарі ви платите за гнучкість, і якщо вам не потрібна гнучкість, ви платите за те, що вам не потрібно.

Якщо ваше навантаження гнучка, але дещо інтенсивна і покладається на певні функції обладнання (див. Відповідь аеісмаїли), ви можете спробувати поділитися кластером з іншими людьми у вашому університеті, щоб амортизувати цикли простою. У моєму старому університеті працює такий спільний кластер із "Моделью акціонерів", в якій кожній групі гарантується частка обчислювальної потужності, пропорційна їхнім вкладенням у апаратний та простой цикл, може використовувати будь-хто. Єдина складність полягає в централізації управління кластером.


3
Місце на плямі, ключовим є "кількісно вимірюється та константа". Зазвичай навантаження значно варіюється, і цілком можливо, що надмірне використання може коштувати набагато вище, ніж 300 доларів / ядро. Крім того, під час налаштування хмарних обчислень легко масштабувати до кількох примірників, якщо це потрібно тимчасово (за тиждень до конференції?).
Філ Х

1
+1 для цього. Моє використання кластерів переходить від 0 до періоду періоду "Ти що зробив!". Я не можу дозволити собі заплатити за друге, що є навколо, коли мені це потрібно.
Фоміт

7

Є деякі речі, про які слід турбуватися, коли ви робите хмарні обчислення з моделюванням MD. Наприклад, вам потрібно потурбуватися про фізичне розташування процесорів у фермі серверів, де ці завдання будуть виконуватись. Причина полягає в тому, що, залежно від розміру моделювання та виду обчислень, які ви виконуєте (наприклад, системи з електростатикою), ви можете сильно залежати від FFT - і підштовхувати електрони до різних процесорів у гігантському кластері може стати дуже трудомісткою частиною загального обчислювального часу.

Крім того, для даних, таких як об'єм даних, як MD, ви хочете переконатися, що у вас є швидке завантаження та завантаження з'єднань із серверами, а також розумні обмеження на зберігання даних. В іншому випадку велика економія коштів може витягнути втрату продуктивності та плату за зберігання.

Наскільки це варте, наш інститут щойно придбав близько 240 ядер для нашого локального кластера за ціною менше 500 євро на ядро. Ця вартість включає хостинг та адміністрування, а також обслуговування, на нашому кампусі протягом чотирьох років. Щорічно, що здається смішно дешевим. Я думаю, що це, мабуть, найкраще з обох світів - місцевий доступ, але професійно підтримується, не потребуючи власної ІТ-команди.


5

У мене немає досвіду роботи з хмарними сервісами, такими як EC2 Amazon, але фактична вартість одного ядра, ймовірно, набагато більша, ніж ви цитуєте: це вартість початкової покупки, електроенергії, охолодження, місця в будівлі, обладнання для заміни. Плюс вартість адміністрування: налаштування ОС та кластерних служб, постійне оновлення ОС, усунення несправностей у черзі тощо. Я б не здивувався, якщо сума всього цього вдвічі перевищує вартість первинної покупки. Звичайно, ви отримуєте гнучкість.

Як на мене, модель зводиться до масштабу: Якщо у вас справді великий кластер (1000 ядер і більше), ви можете амортизувати робочий час, ремонт, системне адміністрування, оскільки цього достатньо зробити, щоб професіонал зайнявся. Якщо у вас є невеликий кластер, де не варто, аби спеціальна людина займалася цим, то, ймовірно, ви змусите когось зробити це, першою роботою якого слід займатися наукою, і в такому випадку час цієї людини погано витрачається на такі адміністративні роботи. Саме тут світяться послуги на вимогу, такі як хмарні сервери.


У моїй лабораторії електроенергія, охолодження та простір для нашого кластеру сплачуються за рахунок скорочення, який наш університет вилучає з наших грантів за плату за послуги. Цей зріз є тим самим, чи ми запускаємо кластер чи ні. Чи знаєте ви, чи є ситуація в більшості університетів, або більшість лабораторій застряють, платячи за охолодження тощо, безпосередньо з кишені?
тел

1
Я вважаю, що більшість лабораторій мають таку ж домовленість, як і ваша, але ігнорувати ці витрати все одно було б неправильно. Комусь доведеться взяти їх за плечі, навіть якщо це не ви особисто. Можливо, варто попросити кафедру / університет отримати більшу частку непрямої вартості, яку вам повернуть, якщо ви погоджуєтеся будувати свій кластер практично в хмарі, а не фізично в кампусі.
Вольфганг Бангерт

4

Як додаток до деяких вже чудових відповідей, слід врахувати ще один фактор:

  • Незалежно від витрат, як ви збираєтесь їх оплатити?

Я стикався з нетривіальною кількістю грантів, які ні за яких обставин не платять за апаратні витрати, але платять за обчислення часу на щось на зразок EC2. Тож, за певних обставин фінансування, хоча ви, можливо, зможете фінансувати невеликий кластер "випробуваного" кластера з неструктурованими коштами або пакетом запуску лабораторії, для масштабних проектів це може бути єдиним способом фінансування ваших витрат на обчислення.

Розглянемо NIH:

ADP / Комп'ютерні послуги: Служби, які ви включаєте сюди, повинні бути специфічними комп'ютерними послугами, наприклад, резервування обчислювального часу на суперкомп'ютерах або отримання спеціалізованого програмного забезпечення, яке допоможе вести статистику. Цей розділ не повинен включати ваш стандартний настільний офісний комп'ютер, ноутбук або стандартну технічну підтримку, що надається вашою установою. Ці види зборів повинні виходити з витрат на збитки та збитки.

Хоча можна поставити кластерні машини під заголовок $ 5000 + обладнання, і ви можете зробити хороший аргумент для цього, я знайшов як рецензентів, які хитрі до цього, так і університети, які вагаються з приводу поточних витрат на утримання такого система.

Деякі гранти ще суворіші. Один грант, який я наразі маю, звучить так:

Кошти також не можуть використовуватися для комп'ютерного обладнання

Часто просто простіше отримати кластер, який оплачується прямими витратами, якщо його базується на EC2 або один із його багатьох аналогів, ніж фактично купувати обладнання, особливо якщо ваша установа загрожує непрямими витратами. Це може бути не для вас, але це стосується деяких.


Я думаю, що це не гарний аргумент. Я лише знайомий із системою фінансування в США, але там, якщо ви вкладете певну суму грошей у категорію "Обладнання", ви можете використовувати її для придбання кластеру. Звичайно, якщо ця категорія порожня, ви запитували неправильний набір доларів. Обладнання насправді має приємну перевагу в тому, що якщо це одна одиниця обладнання, яка перевищує ціну за 5 тис. Доларів США, ви взагалі не платите за це накладні витрати (принаймні, в нашому університеті).
Вольфганг Бангерт

@WolfgangBangerth Детальну інформацію див. У моїй редакції - розміщення її під категорією "Обладнання" може не допустити.
Фоміт

Так, якщо це умови, то нічого не можна зробити. Але я виявив, що якщо у вас є хороший випадок, чому ви вимагаєте грошей на обладнання в гранті, тоді рецензенти зазвичай йдуть з цим - це все одно не є великою часткою загальної суми. Звичайно, якщо грошей не було заплановано на початку, з цього приводу нічого не можна зробити.
Вольфганг Бангерт

0

Відповідей бога вже багато. Я просто хочу додати дві невеликі бали.

1.) Я знаю, що IBM пропонує щось подібне. Отже, залежно від вашої заявки, можливо, варто порівнювати різні пропозиції. Не тільки щодо вартості, але й обладнання.

2.) Звичайно, більшість лабораторій занадто малі, щоб мати можливість інвестувати у власний кластер. Таким чином, питання полягає в тому, чи неможливо зібрати кілька лабораторій разом та інвестувати в кластер, який розділяється між різними лабораторіями. Це має, крім очевидного ефекту розподілу витрат, також перевагу більш рівномірного розподілу навантаження.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.