Відповіді:
PETSc використовує BLAS для декількох векторних примітивів, але вони, як правило, обмежені пропускною здатністю пам’яті, і «оптимізація» не відрізняється великою кількістю розбіжностей, тому вона, як правило, не робить великої різниці в продуктивності.
Він також використовує Lapack для деяких аналізів, таких як оцінки Ланцоса або Арнольді щодо власних значень та сингулярних значень, але вони, як правило, не залежать від продуктивності.
Операції густого "рівня 3", як правило, відображаються лише в контексті, залежно від продуктивності, коли використовуються розріджені прямі вирішувачі з сторонніх бібліотек (наприклад, MUMPS, SuperLU, UMFPACK), і в цьому випадку заповнення зрештою призводить до щільних проблем, які досить великі, щоб отримати користь виклик BLAS.
Якщо ви покладаєтесь на ці рідкісні прямі вирішувачі, застосовані до великих проблем, тоді варто будувати з налаштованою реалізацією BLAS, інакше це має дуже незначну різницю.