Я вже розробив робоче рішення методу Кінцевих елементів для вирішення проблем передачі тепла за допомогою GPU та OpenCL методом Conjugate Gradient. Основним недоліком цього методу є високий попит на пам'ять. Більше того, у випадку з відеокартами пам'ять часто дуже обмежена. Я бачу два варіанти:
- Створіть субдомени та обміняйте частинами мережі з пам'яттю хоста
- Використовуйте мультифронтальні методи
Я маю враховувати конкретну архітектуру. Обмін може бути дуже дорогим. Метод CG популярний в контексті обчислень GPGPU, але я не можу знайти порівняння між CG та мультифронтальними методами (у випадку GPGPU). Чи може мультифронтальний метод бути швидшим, ніж CG? Це загальне питання, насправді це все ще залежить від реалізації.