Вам потрібно буде знати модель та постачальника процесорів на вашій машині. Після цього ви можете подивитися на веб-сайті постачальника (або, можливо, у Вікіпедії) тактову частоту, кількість мікросхем / розеток, кількість ядер на чіп, кількість операцій з плаваючою комою за цикл та векторну ширину цих операцій . Тоді ви просто примножуєте.
Візьмемо, наприклад, процесори Intel Xeon E5-2680 "Sandy Bridge" в Стамппеде, де я працюю. Технічні характеристики:
- 2,7 ГГц
- 2 мікросхеми / вузол, 8 ядер / чіп
- 2 векторні інструкції / цикл
- 256-розрядні інструкції AVX (4 одночасних операнди подвійної точності)
Помноження на це дає 345,6 GF / вузол або 2,2 PF для неприскореної частини системи.
Зазвичай ми думаємо з точки зору операцій з подвійною точністю (64-бітні), тому що це точність, необхідна для переважної більшості наших користувачів, але ви можете повторити обчислення в умовах одноточності, якщо хочете. Зазвичай це змінює лише останній фактор, скажімо, 8 SP Flops / інструкція замість 4 DP Flops / inst, але він може дико відрізнятися від цього. Наприклад, більш старі графічні процесори робили DP лише приблизно на 1/8-й швидкості SP. Якщо ви коли-небудь цитуєте номер для вашої системи, вам слід чітко вказати, який ви використовували, якщо це не подвійна точність, тому що люди будуть вважати, що це було, інакше.
Крім того, якщо ваш чіп підтримує плавлені інструкції з множенням додавання (FMA), і він може виконувати їх на повній швидкості, то більшість людей вважають це двома операціями з плаваючою комою, хоча апаратний лічильник продуктивності може вважати його лише однією інструкцією.
Нарешті, ви також можете зробити це для будь-яких прискорювачів, які можуть існувати у вашій системі (наприклад, GPU або Xeon Phi) і додати цю продуктивність до продуктивності процесора, щоб отримати теоретичну підсумкову.