Nvidia K20X проти GeForce Titan для прискорення GPGPU

10

Я намагаюся зрозуміти різницю між цими двома відеокартами для академічних обчислень, спеціально для компонента DGEMM.

Якщо ми подивимось на необроблені статистичні дані, обидва мають однаковий чіп GK110, мають порівнянні статистичні дані практично в кожній категорії, і, я вважаю, мають однакову архітектуру ядра. Перед будь-якими знижками K20X приблизно в 4 рази перевищує вартість "Титану". З точки зору ефективності, здається, є багато сенсу використовувати Titan над K20X.

Мені важко зрозуміти різницю тут, може хтось висвітлює ситуацію?

Як на замітку, я дивлюся на придбання цих карток для стійкового сервера і запускаюсь з повним нахилом по суті, поки вони не помруть; однак я не вважаю ефективність використання декількох графічних процесорів для однієї роботи особливо важливою.

performance gpu efficiency

— Офіон
джерело

13

Існують деякі відмінності, однак вони не обов'язково в апараті чи специфікаціях. Зауважте, що це вся інформація, яку я отримав на форумах чи випусках новин, тому сприймайте все це із зерном солі.

Перший - "масштабованість та надійність" ( джерело ). K20 був розроблений для того, щоб сидіти в кластерній системі та працювати при повному нахилі 24/7. Титан призначений більше для ігор, тому він буде працювати на цьому робочому циклі, але він може зазнати проблем із довготривалим терміном експлуатації, якщо використовувати його таким чином.

Водії також різні, проте я не впевнений у основних відмінностях. Різниця у фокусі дизайну карт, ймовірно, призводить до порівняно невеликого підвищення продуктивності карт Tesla на цьому фронті.

"Деякі ексклюзивні функції Tesla включають:

NVIDIA GPUDirect RDMA для продуктивності InfiniBand
Hyper-Q для MPI (Hyper-Q для потоків CUDA підтримується на GeForce GTX TITAN)
Захист ECC для всіх внутрішніх і зовнішніх регістрів і пам'яті
Підтримувані інструменти для управління графічним процесором та кластерами, такі як Bright Computing, Ganglia. "( Джерело )

Це вказує на той факт, що основна відмінність полягає в їх масштабованості. Якщо ви хочете працювати на робочому столі у своєму офісі, важко буде сперечатися проти «Титану» над K20 за різницю в ціні. Якщо вам потрібна додаткова продуктивність декількох K20, знайдіть собі центр HPC і купіть час з їх серверами.

Редагувати:

Подивившись трохи більше на ECC, я оновлюю цю відповідь, щоб вказати на наслідки наявності її на K20, а не на Titan. Наступна інформація - це парафраза інформації, яку можна знайти тут .

ECC - це перевірка помилок на DRAM та реєструється для GPU. М'які помилки бувають, коли біт неправильно передається / зберігається. Чим швидше і ближче один до одного ланцюги, тим вище ймовірність м'якої помилки. Якщо ви вирішуєте набір з'єднаних ODE або лінійну систему, одне число, відключене одним бітом, може істотно змінити результати невідтворюваним способом. Більшість стандартних оперативної пам’яті та кеш-пам'яті в процесорі перевіряють помилки на наявність цих помилок за допомогою ECC.

З іншого боку, графічні процесори взагалі не мають ECC, хоча шина пам'яті набагато швидша, ніж у процесора. Це тому, що якщо піксель на екрані трохи відключений на один кадр, якість програми не знижується. Ці помилки також не пропонуються. Таким чином, багато чіп-нерухомості (і вартості) можна заощадити, пропустивши цю функцію. Ця додаткова складність, ймовірно, спричиняє значну частину додаткової вартості лінії Tesla.

— Годрик Провидця
джерело

3

Чудова відповідь +1! Важко повірити, що ці особливості такі дорогі. Я думаю, що рядок "Розвивайся з GeForce, розгортайся з Tesla" із пов’язаного сайту Nvidia підсумовує важливі проблеми. Схоже, найкращим рішенням на сьогодні є придбання декількох GeForces та запуск їх, поки вони не відмовляться від синього диму, так би мовити.

— Офіон

3

"Однак це не завадило їм використовувати їх у" Оакрідж ". OLCF в Cray Xk7 під назвою "Титан" використовує Tesla K20 графічних процесорів, а НЕ GTX Titan. NVidia каже, що GTX Titan має "технологію" OLCF Titan, що є тим же словником, який використовується, коли кажуть, що економічний автомобіль має "технологію" автомобіля Формули-1. (Продуктивність GTX Titan досить хороша, але вона не має ECC і не використовується в жодних основних установах, про які я знаю.)

— Jed Brown

1

Моя помилка, я неправильно трактував статтю. Я оновлю відповідь, щоб не вводити в оману.

— Годрік Провид

2

На мою думку, різниця, здається, полягає в основному сегментації ринку. Якщо ви вчений, то NVidia хоче, щоб ви побоювалися, що ваш папір буде відхилений, оскільки ви використовуєте GPGPU без такої кількості виправлень помилок, як це було б доступно для K20X. Точно так само, якщо ви корпорація, то, можливо, ви хочете заплатити 4 рази, якщо це означає, що ви менш за все подали позов за підозру, що ваші розрахунки не є максимально виправленими помилками. Індивідуальні геймери або любителі GPGPU'ers продаються Titan, оскільки у них менше грошей, і їх важче переконати в таких способах.

— k20
джерело

2

Я виконував розрахунки лише з ECC, чи трапляється у вас гарна стаття, яка демонструє збої в системах, що не належать до системи ECC, та логічні точки перерви, де це вигідно?

— Офіон

2

@Ophion Дослідження ефектів коду, що виправляє помилки на симуляції молекулярної динаміки, прискореної графічним процесором ---> це може вас зацікавити.

— BenC

Для тих, хто хоче резюме виконавця дуже відмінного зв’язку від BenC: м'які помилки, які виправлятиме ECC, надзвичайно рідкісні, і папір іде так далеко, як рекомендувати вимкнути ECC на Tesla для збільшення швидкості. Caveat: насправді це не перевірено на споживчих GPU.

— напів зовнішній

0

Це дійсно залежить від програми, яку ви запускаєте. GPUGRID.net працює на машинах, на яких немає ECC, і все в порядку. Результати такі ж хороші, як і на будь-якій іншій платформі. Acellera також продає обладнання з картками GeForce, і лише в дуже небагато випадках графічні процесори вийшли з ладу. GeForce - це все, що вам потрібно.

— Девід
джерело