Автоматична повторна синхронізація RAID?


11

Я досить випадковим чином перевіряв стан моїх RAID-масивів cat/proc/mdstatі зрозумів, що один з моїх масивів здається перейменуванням:

md1 : active raid1 sdb7[1] sdc7[0]
      238340224 blocks [2/2] [UU]
      [==========>..........]  resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec

Чому це і що це означає? Я, здається, можу отримати доступ до точки монтажу просто добре з r/wдозволами.

EDIT 1 (у відповідь на відповідь SLM )

Я насправді нічого не бачу, якщо я grepперейшов, dmesgі --detailперемикач мені теж не дуже розказує, тобто він показує, що пересинхронізація триває ... але жодних натяків на причину або про те, чому це могло вийти з синхронізації .. - Напевно, мені може знадобитися просто слідкувати за цим, перш ніж почати міняти обладнання.

Відповіді:


10

Це, мабуть, свідчить про те, що синхронізація між двома членами RAID не синхронізується один з одним.

1. Досліджуйте журнали

Я би дослідив ваші dmesgжурнали і побачив, чи є повідомлення про те, що будь-який з фізичних жорстких дисків, що входять до цього масиву, має апаратні збої.

2. Перевірте mdadm

Ви також можете проконсультуватися mdadmза допомогою --detailперемикача, щоб дізнатися більше інформації про пересинхронізацію так:

$ sudo mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.03
  Creation Time : Sat Jan 26 09:14:11 2008
     Raid Level : raid1
     Array Size : 976759936 (931.51 GiB 1000.20 GB)
  Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Fri Jan  1 01:29:16 2010
          State : clean, resyncing
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

 Rebuild Status : 50% complete

           UUID : 37a3bfcb:41393031:23c133e6:3b879f08
         Events : 0.2178969

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1

Якщо обидва пристрої здаються нормальними, і ви не можете точно визначити, на якому пристрої виникає проблема, можливо, вам потрібно тимчасово запустити діагностичний інструмент, такий як HDAT2 або SpinRite, проти кожного жорсткого диска, щоб підтвердити їх стан.

3. Кабель

Якщо жорсткі диски перевіряються, то я б розпочав ретельний аналіз кабелів, я зазвичай підміняю їх.

4. Контролер

Далі я б детально вивчив сам контролер, або витягнувши диски із ураженої системи та діагностувавши їх у вторинній системі, або додати картку сторонніх контролерів до постраждалої системи для подальшого діагностування проблеми.

5. Блок живлення

Вірите чи ні, у мене в минулому виникали проблеми із жорсткими дисками та RAID, коли заміна виходу з ладу або збирання виходу з ладу електроживлення вирішила мої проблеми зі здоров’ям RAID.


@cerr - так, якщо resyncs просто продовжує відбуватися через те, що, здається, випадкові інтервали, то, ймовірно, один із жорстких дисків вже виходить, або 3,4, або 5. Прояв, який ви описуєте, у мене сталося кілька разів я сам, і це були ті ситуації, які вирішили ці невдачі для мене в минулому.
slm

8

Перевірте свої файли cron, багато дистрибутивів проводять планову пересинхронізацію / повторну перевірку раз на тиждень.

У CentOS 7.1 він знаходиться в /etc/cron.d/raid-check

# Run system wide raid-check once a week on Sunday at 1am by default
0 1 * * Sun root /usr/sbin/raid-check

Для налаштування поведінки edit / etc / sysconfig / raid-check


Хоча зазвичай це лише перевірка, а не
пересинхронізація

2
@frostschutz ... хіба що це перша неділя місяця: serverfault.com/a/255549/299551 У такому випадку повторна синхронізація вимушена.
Ден

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.