У мене виникли деякі btrfs та ext4 помилки. Вирішивши перевірити свою ОЗУ, я отримав наступні повторювані помилки memtester
. Я завжди отримую подібні помилки після трохи роботи memtester
. Зазвичай за годину, але це займало 4-5 годин за один раз.
Оперативна пам’ять мого комп’ютера паяна. У мене з'явився додатковий порожній слот. В BIOS немає налаштувань для відключення оперативної пам'яті на борту.
Я бігав:
- Memtest86 + за 8 проходів (~ 8 годин)
- MemTest86 за 18 проходів (~ 9 годин)
memtester
таstressapptest
за замовчуванням Fedora 27, встановленого на USB-накопичувачі (~ 10 годин)memtester
таstressapptest
на Ubuntu 17.10 Live за замовчуванням (~ 2 години)memtester
іstressapptest
на Ubuntu 17.10 на USB-накопичувачі (~ 8 годин)# debsums --changed
єдиним зміненим файлом було зображення теми.
Вони не надрукували жодних помилок.
Я використовую Ubuntu 17.10 (оновлений з 17.04) з ядром за замовчуванням. Ядро не заплямоване. Це ноутбук ASUS з Intel Haswell i3.
- Також тестовано з Linux 4.14.13 та 4.15.0-rc3, rc4, mainline.
- Тестували також із продувним пакетом Intel-microcode.
Помилка відтворюється: або Nouveau вимкнено, або ввімкнено, не завантажуються бінарні драйвери nvidia.
До чорного списку входять наступні модулі: mtd
intel_spi_platform
intel_spi
оскільки вони не завантажуються за умовчанням, встановити Fedora 27, і вони, здається, цегляні деякі ноутбуки Lenova. Помилки не припинялися.
uname -a
вихід
Linux hostname 4.13.0-19-generic #22-Ubuntu SMP Mon Dec 4 11:58:07 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux
# lsmod
вихід
https://paste.ubuntu.com/26222245/
Fedora 27 в # lsmod
«S Вихід
https://paste.ubuntu.com/26226473/
Нинішня ситуація
Я поставив свій жорсткий диск у ноутбук (резервний ноутбук), який, як я знаю, хороший, і провів там тести. Я отримав помилки. Зараз я впевнений, що це проблема програмного забезпечення. Я ніколи не міг викликати помилки на своєму ноутбуці зі свіжим Ubuntu, а також із Fedora, що намагався багато-багато годин.
Що я повинен зробити?
Зразок помилок:
Loop 6:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
Compare DIV : ok
Compare OR : ok
Compare AND : ok
Sequential Increment: ok
Solid Bits : ok
Block Sequential : ok
Checkerboard : ok
Bit Spread : ok
Bit Flip : testing 262
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94000.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94008.
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94010.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94018.
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94020.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94028.
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94030.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94038.
Walking Ones : ok
Walking Zeroes : ok
8-bit Writes : ok
16-bit Writes : ok
Подібна помилка з обома слотами оперативної пам’яті заповнена:
Loop 1:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
Compare DIV : ok
Compare OR : ok
Compare AND : ok
Sequential Increment: ok
Solid Bits : ok
Block Sequential : ok
Checkerboard : ok
Bit Spread : testing 4
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80000.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80008.
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80010.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80018.
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80020.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80028.
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80030.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80038.
Bit Flip : setting 141
Помилка stressapptest
:
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e000(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e008(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e010(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e018(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e020(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e028(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e030(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e038(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Я підозрюю, що конфігурація Ubuntu у поєднанні з обладнанням мого ноутбука винна в цих помилках. Майже кожного разу в пачках по вісім.
Неважлива, нещільно пов’язана інформація нижче
Про помилки btrfs; Я використовував 17.04. Я запитав навколо в btrfs 'irc. Мені сказали, що це може бути апаратна помилка чи якось помилка управління пам'яттю. Частина сторінки метаданих btrfs заповнена нулями, як я відчував зараз. Я пробіг пам’ятку лише кілька проходів, перейшов на ext4 і поклав провину на бінарний драйвер nvidia.
Команди та їх параметри, які я використовую:
# stressapptest -M 10000 -s 1800
10000 - це наявна пам'ять, яку я можу протестувати. Я отримую це через free -m
-s` це секунди.
# memtester 4096
Процесор ноутбука має 2 ядра, тому я зазвичай запускаю два екземпляри. 4096 - це половина наявної пам’яті черезfree -m
memtest86+
будь-яку установку UCDU LiveCD.