Оперативна пам’ять тестує непослідовно - що найвірогідніший винуватець? (тобто на що я повинен витратити гроші на заміну)


20
  • Материнська плата: GA-B85M-DS3H-A
  • Процесор: Core i5 4430
  • ОЗУ: PNY XLR8 DDR3 32 ГБ (4х8 ГБ) 1600 МГц (MD32768K4D3-1600-X9)
  • Блок живлення: EVGA 500 W1 80+

Проблема

Із усіма встановленими 32 ГБ оперативної пам’яті система постійно виходить з ладу MemTest86 + 6.2. Поломка завжди виникає під час першого проходження, і помилки швидко зростають до мільйонів помилок. Спроба запустити Windows призводить до випадкових перезавантажень та зупинки помилок (як можна було б очікувати з помилками ОЗУ).

Що я пробував

  • Тестуйте один 8 Гб модуль PNY в розетці DIMM1. Успішно завершує 4 пропуски MemTest.
  • Тестуйте один 8 Гб модуль PNY в розетці DIMM2. Успішно завершує 4 пропуски MemTest.
  • Тестуйте один 8 Гб модуль PNY в розетці DIMM3. Успішно завершує 4 пропуски MemTest.
  • Тестуйте один 8 Гб модуль PNY в розетці DIMM4. Успішно завершує 4 пропуски MemTest.
  • Перевірте всі чотири 8 Гб PNY DIMM окремо, окремо, у розетці DIMM1. Усі модулі успішно виконують 4 проходи MemTest.
  • Перевірте два модулі PNY 8 ГБ у розетках DIMM1 та DIMM2. Успішно завершує 4 пропуски MemTest.
  • Випробуйте два 8 ГБ модулів PNY в розетках DIMM3 і DIMM4. Успішно завершує 4 пропуски MemTest.
  • Перевірте материнську плату з чотирма 2 Гб відомих хороших DIMM-файлів у всіх розетках. Успішно завершує 4 пропуски MemTest.
  • Поміняйте місцями замовлення PNY DIMM у розетках. Ніяких змін - помилки MemTest все ще трапляються.
  • Підніміть напругу оперативної пам’яті на материнській платі з 1,5 В до 1,65 В. Ніяких змін - помилки MemTest все ще трапляються
  • Грайте з різними комбінаціями ручних налаштувань оперативної пам’яті в утиліті налаштування - включення / відключення профілю XMP, встановлення попередньої настройки «підвищеної стабільності» тощо. Ніяких змін, помилки MemTest все ще не трапляються.

Я думаю, що я можу сміливо виключати погану оперативну пам’ять і погані розетки ОЗУ. Тільки раз MEMTEST тести не є , якщо всі чотири модуля 8GB встановлені одночасно.

Я вимірював напруги, що відходять від блоку живлення, і все, що там здається, стабільне навіть при встановлених чотирьох паличках.

Коли я це пишу, я спробував останній варіант ручного зменшення швидкості оперативної пам’яті до 1066 МГц в BIOS. Поки MemTest виконав один прохід і на другому - без помилок. (Усі вищеперелічені тести були виконані на вбудованій швидкості оперативної пам'яті 1600 МГц.) Це може дозволити мені використовувати систему, хоча і з трохи повільнішими швидкостями ОЗУ, але це, здається, не є постійним виправленням.

Щоразу, коли виникають помилки MemTest, вони завжди трапляються в тому самому точному положенні на 64-розрядної шині адреси:

Bit Error Mask: 00000000FF000000

Крім того, помилки НІКОЛИ не трапляються за межі 4 ГБ. Іншими словами, всі помилки трапляються в адресному просторі між 4 ГБ і 32 ГБ.

Я вважаю, що це є якоюсь дивною проблемою взаємодії чи часу з процесором та оперативною пам’яттю та материнською платою, оскільки помилки дуже послідовні, трапляються лише в одній конкретній конфігурації, видаються пом'якшеними уповільненням оперативної пам'яті, трапляються лише над бар'єром 4 Гб. Моє запитання: чи є ймовірніше, що винуватцем є мій процесор чи моя материнська плата?

Я мав намір модернізувати цю машину до Core i7-4790K, тому якщо процесор є вірогідним винуватцем (я знаю, що контролер пам'яті знаходиться на процесорі в цих нових моделях), то це спрацьовує добре, тому що я планую оновити все одно, але мені цікаво, чи є ймовірність, що сама материнська плата також може бути частиною проблеми. тобто я б не хотів витрачати гроші на процесор i7 лише для того, щоб відчути ту саму проблему і дізнатися, що мені також доведеться замінити материнську плату ...

Поради?


EDIT: Більш повільна швидкість оперативної пам’яті все ж створювала помилки, але лише одного разу тест досяг третього проходу. Я перезапустив тест лише одним процесором, активним лише для перевірки взаємодії на самому процесорі.


Єдиний спосіб підтвердити, чи це пам'ять, mobo або процесор - це тестування оперативної пам'яті в іншій сумісній системі.
Моав

2
Якщо проблема не змінюється при переміщенні мікросхем оперативної пам’яті, материнська плата є суттєвою.
Джошуа

1
Коли ця пам’ять працює у подвійному або коли у вас є 4 (8 г) модулі, ви, можливо, зможете зняти її з SPD (авто) та трохи налаштувати таймінги та примусити її працювати. скажімо, це 10,11,10,24, налаштуйте його на 11,12,11,32 і замість цього випробуйте. (так, це здогадка) Якщо це працює на 100% нон-стоп, то це менше ймовірність виникнення тепла або проблеми з материнською платою. Люди з модулями 4x8gig мали проблеми, які ви описали раніше, якщо є підтримка регулювання напруги, а на процесорі немає зігнутих штифтів, це може бути способом повернення матеріалів, які не знаходяться в списку порівнянності, працювати. тому перевіримо це і поверніться до нас.
Psycogeek

2
"Більш повільна швидкість оперативної пам’яті все ж створювала помилки, але лише після того, як тест досяг третього проходу". Під час будь-якого з цього ви робите додаткові кроки, щоб перевірити охолодження оперативної пам’яті? Навіть тимчасовий доданий вентилятор або зовнішній вентилятор, що рухається повітрям через таран, і його регулятор напруги регулювання напруги, може перевірити, чи є теплом одне з проблем.
Psycogeek

@Psycogeek +1 за пропозицію зміни часу. Деякі модулі оперативної пам’яті не грають добре з іншими, наскільки йде час (навіть тієї ж марки або типу модуля). У мене була подібна проблема з ОП, і я вирішив, встановивши таймінги вручну.
Amziraro

Відповіді:


18

Це не здається, що будь-який компонент несправний, скоріше ви використовуєте несумісну комбінацію.

Наявність декількох розеток на одній заповненій шині пам'яті збільшує ємність у кожній лінії даних та уповільнює час наростання, що може спричинити затримку переходів та неправильне виявлення. Це явище відоме інженерам-електрикам як "вентилятор".

Це ще більше ускладнюється через внутрішній вентилятор модуля пам'яті. Кількість та топологія пристроїв DRAM на модулі, які називаються "ранговими", впливатимуть на кількість модулів, які можна успішно з'єднати паралельно.

Материнські плати серверів, що підтримують багато розеток пам'яті, насправді потребують буферизованої пам'яті, яка використовує каскадну мережу буферів для обмеження вентилятора (і, отже, ємності), що бачиться кожною з них. Затримка викликана самими буферами, але вона збільшується лише логарифмічно з кількістю навантажень, тоді як для небуферизованої ємності пам'ять збільшується лінійно.

Вікіпедія обговорює це: https://en.wikipedia.org/wiki/Memory_rank

Деякі посібники з материнської плати насправді називають такі речі. Для інших можна вивести інформацію зі списків сумісності оперативної пам’яті. Як приклад, материнська плата ASUS Z170-A показує, що подвійний ранг (в керівництві називається DS = двосторонній) може використовуватися лише на двох слотах одразу на цій платі, на відміну від можливості використовувати чотири одноразових DIMM-одиниці одночасно. .

введіть тут опис зображення


Якщо припустити, що це причина проблеми, чи допоможе це вимкнути SPD і змінити параметри часу трохи повільніше, щоб компенсувати більш повільний час підйому / падіння?
brhans

1
Я не впевнений, чи це насправді правильно. Споживчі процесори Haswell, як правило, підтримують чотири ранги пам’яті на канал, що достатньо, щоб чотири двосторонні модулі в двох каналах пам'яті. Чому це питання? Це також, здається, не пояснює той факт, що проблеми трапляються лише за бар'єром 4 Гб. Крім того, в посібнику з материнської плати зазначено, що базовий чіпсет B85 підтримує 32 ГБ пам'яті і не згадує жодних обмежень щодо кількості рангів пам'яті.
bwDraco

2
@bwDraco: Незважаючи на те, що контролер пам'яті знаходиться на процесорі, материнська плата також має значення. Розмітка друкованої плати може вплинути на неї, субоптимальне узгодження довжини зменшить фазовий запас сигналів (саме тому помилки співвідносяться з певними байтами або бітовими положеннями). Те, що посібник з материнської плати не говорить про ранги, не означає, що підтримуються всі комбінації, це просто означає, що це посібник з дерьмом, який не вникає в деталі.
Ben Voigt

1
@brhans: Важливі не параметри часу, а частота тактової пам’яті, оскільки проблема полягає в передачі між процесором і DIMM, а не внутрішньою пам'яттю DRAM. SPD, як правило, має ряд профілів, що відповідають різним тактовим частотам, вибір іншого з них був би кращим, ніж повністю ручне використання.
Бен Войгт

1
Однозначно здається, що проблема цілісності сигналу материнської плати. Більші модулі можуть мати більш високу ємність на штир, ніж менші модулі, особливо якщо самі модулі мають подвійний ранг. Це може спричинити саме це питання, коли ви повністю заповнюєте ряди. Модуль може мати більше одного рангу. Таким чином, чотири ранги на каналі легко можуть бути двома двосторонніми модулями високої щільності. Це може бути посилено електричними характеристиками та маршрутизацією слідів на материнській платі. Моя пропозиція: спробуйте іншу материнську плату.
alex.forencich

9

Це звучить як проблема в інтегрованому контролері пам'яті процесора .

У сучасних системах материнські плати насправді не відіграють ролі в управлінні пам’яттю, крім того, щоб просто прокласти шлях між модулями пам'яті та процесором. Пам'ять безпосередньо підключена до процесора, щоб мінімізувати затримку; " північний міст ", який з'єднує пам'ять з процесором у старих системах, тепер є частиною самого процесора. (Прошивка або PCH можуть контролювати, як процесор працює з оперативною пам’яттю, але це не має сенсу викликати бітові помилки типу, які ви описуєте, як це, зрештою, відповідальність процесора.) Отже, саме перше, що я ' d підозрюваний у такій ситуації є несправним IMC.

Насправді я був би дуже здивований, якби материнська плата або системна прошивка були винні у виникненні проблем.


А як зігнута шпилька?
Майкл Хемптон

6
@Michael: Зігнутий штифт також призведе до відмов тестування окремих модулів.
Бен Фойт

4

Я бачу деякі погані відгуки про BIOS на цій материнській платі. Я б почав з перевірки наявності оновлення BIOS. Ніколи не скупіться на материнську плату.


BIOS поточний. Справді, оперативна пам'ять відсутня у списку "кваліфікованих", але вона має ті ж часові позначки, що й безліч інших перелічених тут модулів.
мільйонів fdmillion

Тоді я б задумався замінити материнську плату. Це не повинно бути на лідері, просто почніть з цінового діапазону, який ви можете собі дозволити, і шукайте ті, у яких найбільше відгуків (прочитайте їх також). Ті, у кого найбільша база користувачів, набагато більше шансів на довгострокову підтримку оновлень BIOS та чіпсетів.
Атоадасо

Ви перевірили, чи здатна ця материнська плата одночасно правильно обробляти 32 ГБ пам'яті? Крім того, ви можете знайти чіп диспетчера пам'яті на материнській платі і переглянути, скільки пам'яті, як очікується, зможе правильно обробити.
milesrf

1

Можливо, що оперативна пам’ять також може бути несправною, хоча вона може і не виглядати. У мене був нещодавній випуск з моїм домашнім сервером, що стосувався фатальної випадковості з крижаним чаєм ...

Я пройшов весь процес заміни кожної частини окремо (2 процесора, mobo, харчування та 2 банки по 16 ГБ (2x8 ГБ) оперативної пам’яті) і все добре перевірив, коли я просто використав один банк оперативної пам’яті з одним процесором (крім 1 процесор, який був тост).

Неважливо, яку конфігурацію я використовував, вона завжди працювала, коли я мав єдиний процесор і банк оперативної пам’яті (будь то 16 Гб або 32 ГБ оперативної пам’яті), але коли я помістив 2-й процесор і розділив оперативну пам’ять, так що це було 16 ГБ в банку, сервер не вдалося завантажити.

Тільки коли я повністю замінив один банк оперативної пам’яті, він остаточно завантажився і запустився належним чином, і це було з тих пір.

tl; dr : Як заявив @moab у своєму коментарі, ви ніколи не можете сказати напевно, поки не протестуєте кожен компонент у сумісній системі

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.