Обчислювальна наука performance

4

Як боротися із занадто великою кількістю даних?

Наші симуляції динаміки плазми часто дають занадто багато інформації. Під час моделювання ми фіксуємо різні фізичні властивості на сітці (x, y, z, t), розміром як (8192x1024x1024x1500), принаймні на 10 властивостей. Ця інформація обробляється після завершення моделювання. З ним ми робити фільми за властивостями, провести аналіз Фур'є, обчислити середні властивості. Цей …

14 performance io data-management

3

Чи є якась користь від компіляції LAPACK з джерела порівняно з встановленням попередньо вбудованого пакету від Ubuntu?

Я знаю, що ATLAS здатний оптимізувати себе для машини, на якій вона компілюється, і, таким чином, максимальні переваги знаходять, компілюючи з джерела. Чи є якась користь від компіляції LAPACK з джерела? Набагато простіше було б просто встановити попередньо вбудований пакет.

13 performance lapack

5

Розрахунок структури розрідження для матриць кінцевих елементів

Питання: Які методи доступні для точного та ефективного обчислення структури розрідженості матриці кінцевих елементів? Інформація: Я працюю над рішенням рівняння тиску Пуассона, використовуючи метод Галеркіна з квадратичною основою Лагранжа, написаний на C, і використовую PETSc для розрідженого зберігання матриць і підпрограм KSP. Щоб ефективно використовувати PETSc, мені потрібно заздалегідь виділити …

13 matrix finite-element petsc performance

3

Використання пам'яті у fortran при використанні масиву похідного типу з покажчиком

У цій вибірковій програмі я роблю те саме (принаймні я так думаю) двома різними способами. Я запускаю це на своєму ПК на ПК та відстежую використання пам'яті зверху. Використовуючи gfortran, я вважаю, що в першому способі (між "1" і "2") використовувана пам'ять становить 8,2 ГБ, тоді як у другому (між …

13 performance fortran

4

Підрахунок FLOP для функцій бібліотеки

Оцінюючи кількість FLOP в простій функції, часто можна просто знизити вираз, що поєднує основні арифметичні оператори. Однак у випадку математичних висловлювань, що передбачають парне поділ, цього не можна зробити, і можна очікувати, що він зможе порівняти з підрахунками FLOP від функцій лише з додаваннями та множеннями. Ситуація ще гірша, коли …

13 performance complexity floating-point

2

Який найшвидший спосіб обчислити всі власні значення дуже великої і розрідженої матриці суміжності в пітоні?

Я намагаюся розібратися, чи існує швидший спосіб обчислити всі власні значення та власні вектори дуже великої і розрідженої матриці суміжності, ніж використання scipy.sparse.linalg.eigsh Наскільки я знаю, цей метод використовує лише розрідженість і атрибути симетрії матриці. Матриця суміжності також є бінарною, що змушує мене думати, що існує швидший спосіб зробити це. …

12 linear-algebra python performance eigensystem scipy

2

Октава: обчисліть відстань між двома матрицями векторів

Припустимо, у мене є дві матриці Nx2, Mx2, що представляють вектори N, M 2d відповідно. Чи існує простий і хороший спосіб обчислити відстані між кожною векторною парою (n, m)? Звичайно, простий, але неефективний спосіб: d = zeros(N, M); for i = 1:N, for j = 1:M, d(i,j) = norm(n(i,:) - …

12 performance octave vectorization

3

У яких випадках застосування схеми адитивного попереднього кондиціонування перевершують мультиплікативні?

І в методах декомпозиції домену (DD), і в багаторешітці (MG) можна створити застосування оновлень блоку або грубих виправлень як добавок, так і мультиплікативних . Для точкових рішень це різниця між ітераціями Якобі та Гаусса-Сейделя. Мультиплікативний плавніший для діє як , застосовується якS ( x o l d , b ) …

12 linear-algebra performance multigrid domain-decomposition

2

Яка основна структура виконання наукового коду?

Розглянемо два комп’ютери з різною апаратною та програмною конфігурацією. Під час виконання точно такого ж серійного коду Navier-Stokes на кожній платформі потрібно x і y час для виконання однієї ітерації для комп'ютерів 1 і 2 відповідно. У цьому випадку - різниця в ітерації між комп'ютером 1 та комп'ютером 2.Δ = …

11 performance iterative-method navier-stokes

1

Статистичні моделі для локальної пам'яті / обчислень, затримки в мережі та тремтіння пропускної здатності в HPC

Паралельні обчислення часто моделюються за допомогою детермінованої локальної швидкості обчислень, затримки накладних витрат та пропускної здатності мережі. Насправді це просторово мінливі та недетерміновані. Такі дослідження, як Скіннер та Крамер (2005), спостерігають мультимодальні розподіли, але, здається, аналіз ефективності завжди використовує або детерміновані, або гауссові розподіли (не просто неточні, він непослідовний через …

11 performance hpc statistics

3

Як реалізувати ефективну функцію індексації для двох інтегралів частинок <ij | kl>?

Це проста проблема перерахування симетрії. Я даю тут повний досвід, але знання квантової хімії не потрібні. Інтеграл двох частинок є: І має такі 4 симетрії: мене є функція, яка обчислює інтеграл і зберігає їх у 1D масиві , індексується так:⟨ я J | до л ⟩ = ∫ г | …

11 algorithms performance

3

Nvidia K20X проти GeForce Titan для прискорення GPGPU

Я намагаюся зрозуміти різницю між цими двома відеокартами для академічних обчислень, спеціально для компонента DGEMM. Якщо ми подивимось на необроблені статистичні дані, обидва мають однаковий чіп GK110, мають порівнянні статистичні дані практично в кожній категорії, і, я вважаю, мають однакову архітектуру ядра. Перед будь-якими знижками K20X приблизно в 4 рази …

10 performance gpu efficiency

1

Який вплив семантики переміщення C ++ 11 у контексті наукових обчислень?

C ++ 11 вводить семантику переміщення, яка може, наприклад, покращити продуктивність коду в ситуаціях, коли C ++ 03 потрібно буде виконати побудову копії або призначення копії. Ця стаття повідомляє, що наступний код має 5-кратну швидкість, коли компілюється з C + 11: vector<vector<int> > V; for(int k = 0; k < …

10 finite-element performance c++

3

Література для моделювання поточних та майбутніх витрат на енергію операцій з плаваючою комою та передачі даних

Я шукаю найважливішу літературу та слайд-посилання для моделювання поточних та майбутніх витрат на енергію операцій з плаваючою комою та передачі даних через процесор, пам'ять, мережу та сховище. Я позначив це питання як вікі спільноти, і я вважаю за краще обмежити кожну відповідь у такому форматі: Назва, Автори, Місцезнаходження / Конференція …

10 performance architecture exascale

3

Яка накладні витрати в розрідженому множенні матриці

Чи множиться матричне множення (і Mat * Mat, і Mat * Vec) з кількістю ненульових значень, або з розміром матриці? Або якесь поєднання двох. Що з формою Наприклад, у мене є матриця 100 x 100 із 100 значеннями, або матриця 1000 x 1000 зі 100 значеннями. Під час складання цих …

10 linear-algebra performance sparse-matrix

Запитання з тегом «performance»