Сьогодні вдень хтось у нашому офісі вирішив витягнути штепсель з нашого сервера, бо він штурмував надворі. Вони не закривали його, вони просто витягнули штекер, поки він працював.
Сервер має 4 накопичувачі SATA в конфігурації програмного RAID 10 та LVM, що працює над RAID. Сервер працює під управлінням CentOS 6.2 Minimal і є хостом віртуальної машини, що використовує KVM. На той момент, коли він був відключений від мережі, на комп’ютері працювало багато гостьових машин. У кожного гостя є один або кілька LVM-розділів, які він використовує безпосередньо як жорсткі диски. Гостьові розділи - EXT3, EXT4 та NTFS. Хост ОС знаходиться на розділі EXT4.
Пізніше, коли влада повернулася, ця людина підключила її назад, і вона запустилася. Оскільки вони підключили його, не приєднавши спочатку монітор, немає ніякого способу побачити, що з’явилося на екрані. Я спробував приєднати монітор зараз, але він не працюватиме, якщо монітор не підключений під час завантаження. Я залишив це так, як є, поки я не можу отримати поради, оскільки не хочу нічого накручувати (далі).
Я можу потрапити в хост через SSH. Я її ще не перезавантажував, якщо у журналі десь є щось, що може бути корисним.
Що мені потрібно зробити, це перевірити всі диски та розділи на цілісність даних, якщо це навіть можливо. Я думаю, що RAID 10 використовує якийсь кеш на основі пам’яті, і я переживаю за те, що накопичувачі несумісні, або файли пошкоджуються, якщо в репліку були речі для запису на диск, який ще не був записаний.
[root@othello ~]# cat /proc/mdstat
Personalities : [raid10] [raid1]
md2 : active raid1 sdc1[2] sda1[0] sdd1[3] sdb1[1]
102388 blocks super 1.0 [4/4] [UUUU]
md0 : active raid10 sda3[0] sdc3[2] sdd3[3] sdb3[1]
1952289792 blocks super 1.1 512K chunks 2 near-copies [4/4] [UUUU]
bitmap: 0/15 pages [0KB], 65536KB chunk
md1 : active raid10 sdc2[2] sda2[0] sdd2[3] sdb2[1]
1022976 blocks super 1.1 512K chunks 2 near-copies [4/4] [UUUU]
unused devices: <none>
Мене також непокоїть те, що він називає мої масиви «майже копіями». Це нормально?
Яку перевірку диска потрібно запустити, щоб переконатися, що з накопичувачами та даними все гаразд? Чи є ще якісь речі, які я повинен перевірити?
ОНОВЛЕННЯ
Вихід mdadm - роздрібний
[root@othello ~]# mdadm --detail /dev/md0
/dev/md0:
Version : 1.1
Creation Time : Sat Feb 25 09:26:20 2012
Raid Level : raid10
Array Size : 1952289792 (1861.85 GiB 1999.14 GB)
Used Dev Size : 976144896 (930.92 GiB 999.57 GB)
Raid Devices : 4
Total Devices : 4
Persistence : Superblock is persistent
Intent Bitmap : Internal
Update Time : Sun Mar 11 12:59:30 2012
State : active
Active Devices : 4
Working Devices : 4
Failed Devices : 0
Spare Devices : 0
Layout : near=2
Chunk Size : 512K
Name : othello.myserver.com:0 (local to host othello.myserver.com)
UUID : 58ba40ab:12516733:e3779362:68200fdd
Events : 2208
Number Major Minor RaidDevice State
0 8 3 0 active sync /dev/sda3
1 8 19 1 active sync /dev/sdb3
2 8 35 2 active sync /dev/sdc3
3 8 51 3 active sync /dev/sdd3