Як перевірити CentOS 6 Server VM Host після відключення живлення?


9

Сьогодні вдень хтось у нашому офісі вирішив витягнути штепсель з нашого сервера, бо він штурмував надворі. Вони не закривали його, вони просто витягнули штекер, поки він працював.

Сервер має 4 накопичувачі SATA в конфігурації програмного RAID 10 та LVM, що працює над RAID. Сервер працює під управлінням CentOS 6.2 Minimal і є хостом віртуальної машини, що використовує KVM. На той момент, коли він був відключений від мережі, на комп’ютері працювало багато гостьових машин. У кожного гостя є один або кілька LVM-розділів, які він використовує безпосередньо як жорсткі диски. Гостьові розділи - EXT3, EXT4 та NTFS. Хост ОС знаходиться на розділі EXT4.

Пізніше, коли влада повернулася, ця людина підключила її назад, і вона запустилася. Оскільки вони підключили його, не приєднавши спочатку монітор, немає ніякого способу побачити, що з’явилося на екрані. Я спробував приєднати монітор зараз, але він не працюватиме, якщо монітор не підключений під час завантаження. Я залишив це так, як є, поки я не можу отримати поради, оскільки не хочу нічого накручувати (далі).

Я можу потрапити в хост через SSH. Я її ще не перезавантажував, якщо у журналі десь є щось, що може бути корисним.

Що мені потрібно зробити, це перевірити всі диски та розділи на цілісність даних, якщо це навіть можливо. Я думаю, що RAID 10 використовує якийсь кеш на основі пам’яті, і я переживаю за те, що накопичувачі несумісні, або файли пошкоджуються, якщо в репліку були речі для запису на диск, який ще не був записаний.

[root@othello ~]# cat /proc/mdstat
Personalities : [raid10] [raid1] 
md2 : active raid1 sdc1[2] sda1[0] sdd1[3] sdb1[1]
      102388 blocks super 1.0 [4/4] [UUUU]

md0 : active raid10 sda3[0] sdc3[2] sdd3[3] sdb3[1]
      1952289792 blocks super 1.1 512K chunks 2 near-copies [4/4] [UUUU]
      bitmap: 0/15 pages [0KB], 65536KB chunk

md1 : active raid10 sdc2[2] sda2[0] sdd2[3] sdb2[1]
      1022976 blocks super 1.1 512K chunks 2 near-copies [4/4] [UUUU]

unused devices: <none>

Мене також непокоїть те, що він називає мої масиви «майже копіями». Це нормально?

Яку перевірку диска потрібно запустити, щоб переконатися, що з накопичувачами та даними все гаразд? Чи є ще якісь речі, які я повинен перевірити?

ОНОВЛЕННЯ

Вихід mdadm - роздрібний

[root@othello ~]# mdadm --detail /dev/md0
/dev/md0:
        Version : 1.1
  Creation Time : Sat Feb 25 09:26:20 2012
     Raid Level : raid10
     Array Size : 1952289792 (1861.85 GiB 1999.14 GB)
  Used Dev Size : 976144896 (930.92 GiB 999.57 GB)
   Raid Devices : 4
  Total Devices : 4
    Persistence : Superblock is persistent

  Intent Bitmap : Internal

    Update Time : Sun Mar 11 12:59:30 2012
          State : active 
 Active Devices : 4
Working Devices : 4
 Failed Devices : 0
  Spare Devices : 0

         Layout : near=2
     Chunk Size : 512K

           Name : othello.myserver.com:0  (local to host othello.myserver.com)
           UUID : 58ba40ab:12516733:e3779362:68200fdd
         Events : 2208

    Number   Major   Minor   RaidDevice State
       0       8        3        0      active sync   /dev/sda3
       1       8       19        1      active sync   /dev/sdb3
       2       8       35        2      active sync   /dev/sdc3
       3       8       51        3      active sync   /dev/sdd3

Відповіді:


3

RAID добре, всі засоби UUUU всі диски в масиві. Я б навіть не турбувався про це наразі.

Що стосується віртуальних машин, якщо ви хочете запускати fscks на них, зупиніть VM і запустіть

fsck.ext3 (ext4, etc) /path/to/lvm (зазвичай, як / dev / vg-name / lv-name)

Якщо ви використовуєте KVM, ви повинні мати можливість virshвиконувати все, що вам потрібно для VM. Ось посилання на сторінку virsh man http://linux.die.net/man/1/virsh

Якщо ви дійсно хочете запустити перевірку дисків на своїх рейдових масивах, вам доведеться перезавантажитись в єдиному користувальницькому режимі або завантажуватися з живого компакт-диска, щоб ви могли переглядати окремі пристрої / dev / mdX. Оскільки основною файловою системою є EXT4, я б не переймався, це набагато краще, ніж EXT3 з відключенням живлення.


+1, спробуємо завтра.
Нік

1

Спробуйте mdadm --detail / dev / md0 (те ж саме для md1 та md2).

Потім спробуйте поради, надані тут: http://linas.org/linux/raid.html


Я розмістив висновок mdadm --detail /dev/md0вище. Я читав посібник, який ви пов’язали, але в ньому не згадується файлова система EXT4, або що конкретно я можу зробити, щоб перевірити цілісність?
Нік

Тип файлової системи не повинен мати значення з точки зору цілісності RAID. Якщо у вас є період технічного обслуговування, ви можете відключити уражені файлові системи та fsckїх. Якщо ви хочете перевірити самі RAID-пристрої, ви можете зробити щось подібне echo "check" > /sys/block/md0/md/sync_action. Або відлуння "ремонт" для нього, щоб зробити якийсь ремонт mdadm.
cjc

Я спробую це завтра і звіту.
Нік
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.