Чи доступні в даний час графічні процесори підтримують арифметику з плаваючою комою подвійної точності?


17

Я запустив GROMACS з молекулярною динамікою (MD) на кластері Ubuntu Linux, що складається з вузлів, що містять 24 процесори Intel Xeon. Моя особлива цікава точка виявляється дещо чутливою до арифметичної точності з плаваючою точкою, тому мені довелося запускати GROMACS в подвійній точності, а не одинарній точності - незважаючи на більш високу обчислювальну вартість подвійної точності. Отже, на кластері я склав GROMACS з подвійною точністю.

Я розглядаю можливість придбання деяких графічних процесорів, оскільки може виникнути відносне збільшення швидкості ("прискорення GPU") для процесорів. Однак мені потрібен графічний процесор, який дозволить мені робити арифметику подвійної точності. Чи знаєте ви, чи таке обладнання є комерційно доступним? Останній пост в списку розсилки GROMACS передбачає , що графічні процесори з подвійною точністю буде не комерційно доступні:

Апаратне забезпечення не підтримує це [арифметика подвійної точності] AFAIK.

Ця сторінка Вікіпедії, схоже, говорить про те, що графічні процесори з подвійною точністю є рідкістю, оскільки вони можуть бути неефективними:

Реалізація плаваючої точки на графічних процесорах Nvidia здебільшого сумісна з IEEE; однак це не так у всіх постачальників. Це має наслідки для правильності, які вважаються важливими для деяких наукових застосувань. У той час як 64-бітні значення з плаваючою комою (плаваючі з подвійною точністю) зазвичай доступні на процесорах, вони не підтримуються на GPU; деякі архітектури GPU жертвують дотриманням IEEE, а іншим взагалі не вистачає подвійної точності. Були проведені зусилля з імітації подвійної точності значення плаваючої точки на GPU; однак швидкість компромісу в першу чергу заперечує будь-яку користь для завантаження обчислень на GPU.

Ця сторінка NVIDIA Tesla в посилання «Пік подвійної точності з плаваючою комою продуктивність» в графіці, здається, передбачає , що подвійні розрахунки точності може , справді, зробити на їх чіпах (хоча і при більш високій вартості обчислень).

Отже, у що я повинен вірити? Чи маєте ви досвід роботи з цим питанням?


ознайомтесь з титаном gtx, він базується на gk110 і має подвійну підтримку цін ..... хоча його трохи дорожче ..... близько $ 1k

У Вікіпедії не завжди є актуальна інформація про швидко мінливі теми ...
Джефф

Відповіді:


17

Подвійна точність досить поширена для новіших графічних процесорів. Наприклад, у мене є NVIDIA GTX560 Ti (досить низький рівень, якщо мова йде про обчислення), який не має проблем із запуском ViennaCL в подвійній точності. З тут (розділ 4) виявляється всі карти NVIDIA з GTX4xx вперед підтримують подвійну точність спочатку.

Я б здогадався, що інформація про GROMACS просто застаріла.


5
Дуже застаріла. Зокрема, процесори NVIDIA протягом багатьох років підтримували подвійну точність. Чесно кажучи, це було значно повільніше, ніж можливість одноточної можливості, але він був там (а не просто наслідувався) в перших GPU-марках Tesla, і, мабуть, до цього. Більш недавні втілення значно зменшили розрив між сигналом та підтримкою подвійної точності.
Майкл Грант

Так, документ, який я зв'язав згадані показники приблизно з коефіцієнтом 8 різниці в продуктивності, коли потрібна емуляція, але тепер, коли чіпи призначені для цього, це ближче до коефіцієнта 2. Я б сказав, що це, ймовірно, пов'язано з затримка пам'яті картки від VRAM до процесорів, але це просто здогад з мого боку.
Годрік Провид

Насправді першочерговою причиною було те, що раніше графічні процесори просто не виділяли багато чіп-простору для обчислень подвійної точності. Відповідно до цієї сторінки , серія GK110 має в 8 разів більше одиниць подвійної точності на "блок SMX" (що б це не означало), ніж серія GK104.
Майкл Грант

1
Ага, так, я фактично мав на увазі різницю в 2 рази в поточних графічних процесорах щодо коментаря про пропускну здатність пам'яті.
Годрик Провид

Готча. Я не мав на увазі спускатися з цієї кролячої нори. Ваша відповідь прекрасна, саме тому я прокоментував і проголосував за вас замість того, щоб додати свою власну відповідь ;-)
Майкл Грант

8

Кожен графічний процесор з SM 1.3 (Tesla / GTX2xx) або вище має апаратну підтримку подвійної точності. Починаючи з архітектури Fermi, варіанти Quadro і Tesla мають кращу підтримку подвійної точності, ніж споживчі моделі Ge Force.

Що дивно, що підтримка подвійної точності Ge Force Kepler / GTX6xx поступається підтримці GeForce Fermi / GTX5xx для покращення диференціації Tesla в Kepler K20 / K20x. Посилюючи дивацтво, Tesla K10s мають підтримку подвійної точності на рівні Ge Force. І зовсім недавно це стало повною мірою у зв'язку з представленням Ge Force GTX Titan, який має повну підтримку подвійної точності та безліч функцій CUDA, наявних лише на моделях Tesla. GTX Titan коштує ~ 1000 доларів - кричущий торг IMO.


2

Ви також повинні прочитати наступне повідомлення зі списку розсилки GROMACS: http://lists.gromacs.org/pipermail/gmx-users/2013-April/080604.html . Незалежно від того, чи реалізація GPU в MD підтримує використання подвійної точності в порівнянній мірі, принаймні настільки ж важливо, як наявна подвійна точність на апаратному забезпеченні.


0

Відповідно до цієї дискусії , для подвійної точності найбільш підходящими є графічні процесори Tesla та Titan (серед графічних процесорів Nvidia).

Шукаючи, наприклад, список графічних процесорів Nvidia у Вікіпедії (аналогічна таблиця для графічних процесорів AMD тут ) та порівнюючи потужність обробки однієї та подвійної точності (з точки зору GFLOP), можна побачити, що продуктивність подвійної точності набагато менша, ніж половина одиничної точності продуктивність для більшості інших графічних процесорів. Наприклад, для серії GTX 900, у статті йдеться про те, що продуктивність подвійної точності становить 1/32 від продуктивності однієї точності, тоді як ця стаття у Вікіпедії говорить, що для серії GTX 700 продуктивність подвійної точності становить 1/24 від одиничної точності продуктивність (за винятком Titan, коли вона може досягати 1/3 одноосібної точності).

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.