Запитання з тегом «simd»

12
Як компілювати Tensorflow з інструкціями SSE4.2 та AVX?
Це повідомлення, отримане від запуску сценарію, щоб перевірити, чи працює Tensorflow: I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcublas.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcudnn.so.5 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcufft.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcuda.so.1 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcurand.so.8.0 …

5
Файли заголовків для внутрішніх технологій x86 SIMD
Які файли заголовків містять суттєві характеристики для різних розширень набору інструкцій SIM86 x86 (MMX, SSE, AVX, ...)? Здається, неможливо знайти такий список в Інтернеті. Виправте мене, якщо я помиляюся.

8
Віднімання упакованих 8-бітових цілих чисел у 64-бітовому цілому на 1 паралельно, SWAR без апаратного SIMD
Якщо у мене 64-бітове ціле число, яке я інтерпретую як масив упакованих 8-бітових цілих чисел з 8 елементами. Мені потрібно відняти константу 1з кожного упакованого цілого числа під час обробки переповнення без результату, коли один елемент впливає на результат іншого елемента. На даний момент у мене є цей код, і …
77 c++  c  bit-manipulation  simd  swar 

1
Сучасний підхід до створення std :: вектор виділяє вирівняну пам'ять
Наступне питання пов'язане, однак відповіді на старі, і коментар від користувача Marc Glisse передбачає , що є нові підходи , починаючи з C ++ 17 до вирішення цієї проблеми , які не можуть бути адекватно обговорені. Я намагаюся вирівняти пам'ять, що працює належним чином для SIMD, але все ще маю …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.