Перші вказівки не обов'язково «виконуються послідовно» навіть на ISA, що не VLIW, виконання повинно бути лише послідовним. Суперскалярна реалізація в порядку може виконувати більше однієї інструкції паралельно іншій. Для цього необхідно збільшити (розширити) апаратне забезпечення для декодування інструкцій, додати апаратне забезпечення для забезпечення незалежності даних інструкцій, що виконуються паралельно, ресурси виконання повинні бути збільшені, а кількість портів файлів реєстру, як правило, збільшена. До всього цього додаються транзистори.
Реалізація поза замовлення, яка дозволяє виконувати більш пізні інструкції до попередніх, якщо немає залежностей від даних, використовує додаткове обладнання для обробки планування інструкцій, як тільки дані стають доступними, і додає регістри перейменування та обладнання для картографування, виділення та звільнення їх (більше транзисторів), щоб уникнути небезпеки після читання та запису після запису. Виконання поза замовленням дозволяє процесору уникати затримок.
Переупорядкування навантажень і сховищ у процесорі, що не працює в порядку, вимагає гарантувати, що магазини, що перебувають раніше в програмному порядку, будуть пересилати результати до наступних завантажень тієї ж адреси. Це передбачає логіку порівняння адрес, а також зберігання адрес (і розмірів) магазинів (і сховища для даних) до тих пір, поки сховище не буде заподіяне пам'яттю (кеш). (Для ISA з менш слабкою моделлю узгодженості пам'яті також необхідно перевірити, чи завантажуються належним чином навантаження відносно сховищ інших процесорів - більше транзисторів.)
Трубопровід додає додатковий контроль і буферизацію накладних витрат і запобігає повторному використанню логіки для різних частин обробки інструкцій, але дозволяє різним частинам обробки інструкції в часі збігатися за різними інструкціями.
Трубопроводи та надскалярне виконання збільшують вплив небезпек управління (тобто умовних гілок та стрибків). Трубопровід (а також виконання поза замовленням) може затримати доступність цілі навіть беззастережних стрибків, тому додавання апаратного забезпечення для прогнозування цілей (і напряму для умовних гілок) дозволяє отримувати інструкції, щоб продовжувати, не чекаючи виконання частини виконання процесор для надання необхідних даних. Більш точні прогнози вимагають більшої кількості транзисторів.
Для процесора поза замовленням може бути бажаним дозволити виконання завантаження з пам'яті до того, як будуть обчислені адреси всіх попередніх сховищ, тому потрібне деяке обладнання для обробки таких спекуляцій, потенційно включаючи передбачувач.
Кеші можуть зменшити затримку та збільшити пропускну здатність доступу до пам'яті, але додайте транзистори для зберігання даних та зберігання тегів (та порівняння тегів із запитаною адресою). Для впровадження політики заміни також потрібно додаткове обладнання. Попереднє завантаження обладнання додасть більше транзисторів.
Впровадження функціональних можливостей в апаратне, а не програмне забезпечення може підвищити продуктивність (вимагаючи більшої кількості транзисторів). Наприклад, управління TLB, складні операції, такі як операції множення або плаваючої точки, спеціалізовані операції, такі як підрахунок провідних нулів. (Додавання інструкцій також збільшує складність декодування інструкцій, а також, як правило, і складність виконання - наприклад, для контролю того, які частини апаратного забезпечення для виконання будуть використовуватися.)
Операції SIMD / вектор збільшують обсяг роботи, виконаної за інструкцію, але вимагають більше зберігання даних (ширші регістри) і зазвичай використовують більше ресурсів виконання.
(Спекулятивна багатопотокова редакція також може дозволити декільком процесорам швидше виконувати одну потокову програму. Очевидно, що додавання процесорів до мікросхеми збільшить кількість транзисторів.)
Наявність більшої кількості транзисторів може також дозволити архітекторам комп’ютерів надати ISA більше регістрів, видимих для програмного забезпечення, потенційно зменшуючи частоту доступу до пам'яті, які, як правило, повільніше, ніж доступ до регістрів, і передбачають деяку ступінь непрямості (наприклад, додавання зміщення до стеку покажчик), що збільшує затримку.
Інтеграція - яка збільшує кількість транзисторів на мікросхемі, але не в системі - зменшує затримку зв'язку та збільшує пропускну здатність, очевидно, дозволяючи збільшити продуктивність. (Також спостерігається зменшення споживання електроенергії, що може бути переведено на підвищення продуктивності.)
Навіть на рівні виконання інструкцій додавання транзисторів може підвищити продуктивність. Наприклад, суматор вибору переносу додає верхні біти двічі паралельно з різними припущеннями перенесення з нижніх бітів, вибираючи правильну суму верхніх бітів, коли доступний перенос із нижчих бітів, очевидно, вимагає більше транзисторів, ніж простий пульсація носіть суматор, але зменшує затримку в отриманні повної суми. Аналогічно, мультиплікатор з одним рядком носіїв збереження використовує менше транзисторів (але повільніше), ніж множник дерева Dadda (або Уоллес) і не може бути конвеєрним (тому його потрібно буде реплікувати, щоб дозволити іншому помножувати розпочати виконання в попередній час розмноження тривало).
Сказане може бути виснажливим, але не є вичерпним!