Чи мають сучасні процесори надмірність у своїх логічних блоках для компенсації виробничих несправностей?


10

Сучасні процесори складаються з мільярдів транзисторів, а нові технології виробництва часто мають проблеми з урожаєм, принаймні, в перші місяці, але я здогадуюсь, що навіть через роки раз у раз з’являться несправні мікросхеми.

Я знаю, що у великих блоках (наприклад, кеш-пам'ять) є можливість просто відключити його частини, і тим самим зменшити доступний об'єм пам'яті (так що ви можете принаймні продати чіп за меншою ціною, а не викидати його). Але чи є щось подібне для логічних одиниць? Я знаю, що для диспетчеризації існує декілька АЛУ, але це лише відключення одного з них, якщо є виробнича помилка? Або є ще додаткові запасні АЛУ? Тому що для мене важко повірити, що файли просто утилізують кожну мікросхему, де є логічний транзистор у логічних частинах, а відключення повної ALU суттєво знизить досяжну потужність обробки.


Лише моя здогадка. Ціна виготовлення кремнієвих пластин порівняно низька у великих кількостях, і ви можете протестувати її перед тим, як утримувати корпус, щоб ви могли виготовити повну стружку з відносно низьким коефіцієнтом відмов. > 50% ціни - це чистий маркетинг. Крім того, я думаю, що багато варіацій процесорів в межах однієї сім'ї зроблені за однією і тією ж топологією і відрізняються лише деякими вимкненими функціями / ядрами та кешами (як ви вже писали), тому виробник має великий розрив у підтримці низького рівня відмов виробництва навіть при пошкоджені одиниці. Але я сумніваюся, що у них, скажімо, є кілька зарезервованих АЛУ для одного і того ж ядра.
циклон125

Я думаю, що найвідомішим прикладом цього був Intel 486SX, який був таким же штампом, як і DX з відключеним FPU. Але мені було б цікаво почути, що це за сучасний стан.
pjc50

Я дуже сумніваюся в цьому. Кількість логіки та час проектування, необхідних для забезпечення низького рівня надмірності на швидкості сучасних процесорів, не варто. Надмірність рівня блоків (core, fpu, кеш) або відключення блоку буде набагато більш ніж достатньо, щоб значно збільшити врожайність. А при нинішніх цінах процесора та розмірах вафель навіть вигідність у 5% може бути вигідною.
Едгар Браун

Отже, ви думаєте, що коли ALU не використовується, вони просто відключають ядро. Так, можливо, є можливість. Я сподівався, що хтось тут справді знатиме.
Джусака

1
Так, вони відключають серцевину. Це практика, яка називається "бінінг".
DKNguyen

Відповіді:


3

Як говорили інші, важко бачити зайву логіку АЛУ в ядрі.

Ядро було розроблено для оптимізації пропускної здатності. Будь-яка додаткова логіка для надлишкової АЛУ вплине на продуктивність, а збільшення площі сповільнить усе ядро. З розвитком технологій кремній ставав меншим, швидше роблячи сердечники, але по суті використовуючи ту саму інтелектуальну власність. Чому надлишкові АЛУ, коли для надлишкової кількості ядер є місце для збільшення врожайності?

У 2011 році Intel подала патент на щонайменше 32 ядра з 16 активними та 16 запасними. У патентному стані відсутні серцевини матимуть більш високі температури, що дозволять включати запасне ядро. По суті, динамічне розподілення ядра за необхідності.

У вас можуть бути виділені ядра високої потужності та низької потужності, як цього вимагають завдання. Або вимкнути поганий сердечник, виявлений більш високими температурами. Експлуатуйте сердечники в шаховому порядку, щоб зменшити тепло.

Патент Intel: підвищення надійності багатоядерного процесора


Це акутно має багато сенсу, я не замислювався про ефективність роботи, яку можуть мати запасні зони кремнію всередині одного ядра. Деактивація цілих сердечників, здається, є шляхом, оскільки інші відповіді також мають на увазі.
jusaca

5

Не в логіці.

Однак якщо є великі спогади (SRAM), звичайно використовувати пам'ять з надмірністю. Вони мають спеціальну логіку, яку можна запрограмувати на заміну області, часто на ряд рядків або стовпців.

Під час тестування виявляється несправна область, а потім надлишкова пам'ять запрограмована на заміну несправних місць.

Однак ця "заміна" повинна бути налаштована за допомогою бітів OTP (одноразово програмовані) або іншої пам'яті, яка має її значення. Таким чином, ці пам'яті використовуються лише в мікросхемах, які мають таку функцію «постійної пам’яті», або така функція програмування також повинна бути додана з усіма витратами, які виникають у зв'язку з цим.


Як ви думаєте, ці біти OTP запрограмовані в електронному вигляді, як спалювання запобіжника чи щось таке, або великим виробникам доводиться йти прямо на штампі з лазерною обрізкою?
jusaca

1
OTP - це мікросхеми, які можна запрограмувати в електронному вигляді (на зразок EEPROM, але потім постійно) Кінцеві користувачі також можуть записувати їх на серійні номери, адресу Ethernet, ключі шифрування тощо
Oldfart

4

Це звичайно не стосується простих MCU або типових одноядерних процесорів. Витрати на запасні блоки не варто, і ці процесори не використовують передові гравірувальні процеси та не потребують величезних кремнієвих площ, тому вихід досить хороший.

Однак це робиться для деяких багатоядерних процесорів, для яких площа кремнію досить велика, і для цього застосовуються більш тонкі гравірувальні процеси, що може призвести до більш високих коефіцієнтів дефектів. У цих процесорах цілі ядра можуть бути відключені (це досить великі логічні блоки, що містять набагато більше, ніж ALU), коли вони несправні. Потім процесор продається як нижча модель.

Джерело: /skeptics/15704/are-low-spec-computer-parts-just-faulty-high-spec-computer-parts


3

Я точно не можу відповісти на ваше запитання точно. Немає особливого сенсу відключати одиниці розміром менше 1 ядра, оскільки це стає дуже дрібним "набором функцій", який можна вмикати чи ні, а декартовий продукт усіх можливих функцій створить безліч можливих моделей процесора. Є багато моделей процесорів вже, що робить їх в 10-100 разів більше , безумовно , не допоможе!

Інший аспект полягає в тому, що мільярди транзисторів використовуються (здебільшого) для створення кеш-пам'яті, а для несправних транзисторів там виробники безумовно продають процесори з відключеними частинами кеш-пам'яті (наприклад, див. AMD Thorton vs AMD Barton).

Але я можу розповісти вам анекдот, який я чув від людини, якій я довіряю. Давно я був цікавим оверклокером. У мої дні на вибір процесора, який вибирався бюджетним процесором, став AMD Athlon Thoroughbred:

Атлон чистокровний

Монтуючи власні охолоджувальні рішення, потрібно було бути дуже обережними, прикріплюючи радіатор, оскільки він притискається безпосередньо до матриці. Якщо ви застосовували нерівномірний тиск, плашки були горезвісні для легкого розтріскування по кутах, якщо ви застосували силу спочатку в одному куті.

Ця людина зробила точно те саме, значна частина одного кута пішла, але центральний процесор чудовим чином працював, хоча і при значно зниженій продуктивності пам'яті. У куті містився лише кеш-пам'ять L2, тож з тією частиною пішла, протокол кешування якимось чином працював навколо дуже дефектної матриці. Ймовірно, повідомлялося про пропуски кеш-пам’яті для всіх запитів у цій частині, тому процесор був зменшений до кешу L1 (або лише частини L2), тому він був набагато повільнішим у більшості тестів, але мав практично однакову продуктивність у жорстких петлях.

У цьому ж думці можна зробити висновок, що якщо АЛУ несправна і здатна якось сигналізувати про те, що вона відхилила роботу, ЦП може бути спроможна повернутися до інших АЛУ. Чи це роблять виробники процесорів, невідомо (і я сумніваюся в цьому), але приклад кешу (з 15 років тому) показує, що це, безумовно, можливо.


Це, звичайно, дуже вражає, і навіть здається, що це якийсь динамічний процес, оскільки система сама виявила несправну частину чіпа. Задаючи питання, я мав на увазі більше виявлення системою тестування на виробничій лінії. Але ця історія безумовно цікава;)
jusaca
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.