Запитання з тегом «gpu»

Блок графічної обробки - спеціалізований, відносно недорогий апаратний блок, побудований для швидких графічних обчислень та наукових обчислень з високою паралельністю даних.

10
Які проблеми піддаються обчислювачам GPU?
Тож у мене є гідна голова щодо того, які проблеми, з якими я працюю, найкращі в серіалі, і з якими можна керуватися паралельно. Але зараз я не маю великого уявлення про те, що найкраще справляється з обчисленнями на базі процесора, і що слід завантажувати в GPU. Я знаю, що це …
84 gpu 

1
CUDA проти OpenCL станом на кінець 2013 року
Як CUDA та OpenCL порівнюють один одного з кінця 2013 року з точки зору програміста? Моя група думає про спробу використовувати обчислення GPU. Чи ми обмежимо себе значно, вибравши апаратне забезпечення, яке підтримує лише OpenCL, але не CUDA? Щоб бути трохи більш конкретним, чи правильні наступні припущення? Все, що можливо …
34 hpc  gpu  cuda  opencl 

4
Для яких статистичних методів GPU швидше, ніж процесори?
Я щойно встановив на робочий стіл графічну карту Nvidia GT660 і після певної боротьби мені вдається з'єднати її з R. Я грав з декількома пакетами R, які використовують графічні процесори, особливо gputools, і я порівнював час, витрачений моїм графічним процесором та процесором на виконання деяких основних операцій: інвертування матриць (процесор …
18 r  gpu 

3
Евклідова відстань в Октаві
Мені хотілося б знати, чи існує швидкий спосіб обчислити евклідову відстань двох векторів в Октаві. Здається, що для цього немає спеціальної функції, тому я повинен просто використовувати формулу sqrt?

4
Чи доступні в даний час графічні процесори підтримують арифметику з плаваючою комою подвійної точності?
Я запустив GROMACS з молекулярною динамікою (MD) на кластері Ubuntu Linux, що складається з вузлів, що містять 24 процесори Intel Xeon. Моя особлива цікава точка виявляється дещо чутливою до арифметичної точності з плаваючою точкою, тому мені довелося запускати GROMACS в подвійній точності, а не одинарній точності - незважаючи на більш …

2
Варіанти вирішення систем ODE на графічних процесорах?
Я хотів би розробити системи ODE на графічні процесори в умовах "тривіально паралелізуючого". Наприклад, роблячи аналіз чутливості з 512 різними наборами параметрів. В ідеалі я хочу займатися вирішенням ODE за допомогою розумного адаптивного вирішення часового кроку, такого як CVODE, а не з фіксованим часовим кроком, як Forward Euler, але запускаючи …
16 ode  gpu 

1
Наукові обчислення з Python із сучасними графічними процесорами з подвійною точністю
Хтось тут використовував подвійні точні наукові обчислення з GPU нового покоління (наприклад, K20) через Python? Я знаю, що ця технологія швидко розвивається, але який найкращий спосіб зробити це на даний момент? Графічний процесор не входить у сферу популярних наукових бібліотек Python numpy та scipy, і я хотів використовувати theano, але, …
14 python  gpu  precision 

4
Паралельні (GPU) алгоритми для асинхронних стільникових автоматів
У мене є колекція обчислювальних моделей, які можна було б охарактеризувати як асинхронні стільникові автомати. Ці моделі нагадують модель Ізінга, але трохи складніші. Схоже, що такі моделі виграють від запуску на графічному процесорі, а не на процесорі. На жаль, паралелізувати таку модель не зовсім просто, і мені зовсім не зрозуміло, …

2
Які найшвидші доступні реалізації BLAS / LAPACK або інших лінійних підпрограм алгебри в системах GPU?
Наприклад, nVidia має CUBLAS, який обіцяє 7-14-кратне прискорення. Наївно, це ніде не є теоретичним пропускною здатністю жодної з GPU-карт карт nVidia. Які проблеми є прискоренням лінійної алгебри на графічних процесорах, і чи є вже більш швидкі лінійні маршрутизації алгебри?

3
Nvidia K20X проти GeForce Titan для прискорення GPGPU
Я намагаюся зрозуміти різницю між цими двома відеокартами для академічних обчислень, спеціально для компонента DGEMM. Якщо ми подивимось на необроблені статистичні дані, обидва мають однаковий чіп GK110, мають порівнянні статистичні дані практично в кожній категорії, і, я вважаю, мають однакову архітектуру ядра. Перед будь-якими знижками K20X приблизно в 4 рази …

3
Тяга для програмування GPU
Я дуже новачок у програмуванні GPGPU, тому, будь ласка, вибачте мене, якщо питання не є особливо підходящим. Як я розумію, програмування графічного процесора є дуже складною інженерною роботою порівняно зі звичайним програмуванням процесора. Потрібно бути дуже обережним щодо питань розбіжності, плитки, закріпленої пам’яті пам’яті та обчислення комунікаційних пристроїв / пристроїв, …

2
Паралельне обчислення великих матриць коваріації
Нам потрібно обчислити коваріаційні матриці розмірами від до . У нас є доступ до графічних процесорів та кластерів, ми цікавимося, який найкращий паралельний підхід для прискорення цих обчислень.10000 × 1000010000×1000010000\times10000100000 × 100000100000×100000100000\times100000

2
Найшвидший спосіб знайти власні пари невеликої несиметричної матриці на графічному процесорі у спільній пам'яті
У мене є проблема, коли мені потрібно знайти всі позитивні (як у власній значенні позитивні) власні пари невеликої (зазвичай менше 60x60) несиметричної матриці. Я можу припинити обчислення, коли власне значення менше певного порогу. Я знаю, що власні значення справжні. Будь-які пропозиції щодо алгоритмів я міг би використати, щоб спробувати витіснити …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.