Як відстежувати стан жорсткого диска позаду Dell PERC H710 Raid Controller з CentOS 6?


26

У мене Dell-сервер працює CentOS 6за допомогою PERC H710картки Raid Controller із налаштуванням Raid 5, і я хочу контролювати відмову / робочий стан жорсткого диска за Raid Controller.

Тоді я маю змогу використовувати скрипт bash для моніторингу стану жорсткого диска та надсилання електронних листів, якщо щось пішло не так.

LSI MegaRAID SASІнструмент командного (Про LSI MegaRAID SAS Linux Tools) для CentOS / Red Hat / Linux не підтримує PERC H710 і smartctlне підтримує його небудь.

На основі веб-сайту Dell CentOSIS не підтримується для цього сервера ( NX3200 PowerVault), і я не зміг завантажити жодну програму Linux для моніторингу жорсткого диска.

[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               DELL
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

Хтось знає, як відстежувати стан жорсткого диска за апаратним рейдом на Dell PERC H710 з CentOS 6?

Відповіді:


26

SMART - не остаточне слово в моніторингу диска чи зберігання !! Це компонент, але сучасні контролери RAID використовують його разом з іншими методами для визначення стану накопичувача та масиву.

Я припускаю, що це контролер PERC на сервері Dell PowerEdge.

Нормальним для Linux підходом до моніторингу стану обладнання Dell є встановлення агентів Dell OMSA для Linux через Yum - http://linux.dell.com/wiki/index.php/Repository/OMSA#Yum_setup

yum install srvadmin-allвстановить повний набір агентів. Після встановлення ви можете скористатися omreportкомандою для отримання інформації про свій масив.

Приклади:

$ omreport storage vdisk

$ omreport storage pdisk controller=0

$ omreport storage vdisk controller=0 vdisk=1

7
це встановить додаткові компоненти, такі як веб-сервер / ssl на мої машини Linux, але, схоже, у мене немає іншого вибору! Не люблю додавати непотрібні пакети на свій сервер.
Xianlin

2
Остерігайтеся можливого витоку пам'яті в одній із цих програм OMSA. Це траплялося зі мною повільно протягом 3-4 тижнів, тоді бум, більше немає пам'яті для Linux.
бксундай

1
Так, витік знаходиться в dsm_sa_snmpd (тому я запускаю 'killall -9 dsm_sa_snmpd', вирішено).
markusN

5
Контролери PERC 7xx і 8xx - це лише контролери LSI Megaraid, а інструмент LSI MegaCLI буде працювати чудово, якщо ви не хочете підкреслити вашу систему бібліотеками Dell і будь-якими іншими сервісами та / або модулями ядра, які вони випадають сьогодні. Існує велика кількість шпаргалок MegaCLI, сценарії моніторингу нагіосів та поради щодо настройки продуктивності для бінарних файлів LSI. Це, звичайно, мої особисті переваги та думка, звичайно. Я мінімаліст.
Аарон

@Xianlin, це не зовсім так. Так, він встановить багато сміття, але дивіться мою відповідь. Я не хотів додавати непотрібні пакунки, тому я з’ясував лише ті, які мені потрібні для зберігання.
Майк S

25

Ви можете бачити статус SMART дисків за допомогою команди smartctl та її -dаргументу. Наприклад, щоб побачити перший диск у масиві:

# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST91000640NS
Serial Number:    ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P     showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#

Це на Scientific Linux 6 (інша ОС на базі RHEL6) з smartmontools-5.43-1.el6.x86_64.


-d megaraid,0було достатньо в smartctl 6.6командному рядку. У DEVICESCANрядку в /etc/smartd.confньому потрібно-d removable
Стюарт Кардлл

9

Прийнята відповідь рекомендує сміливість, яка є yum install srvadmin-all. Blecch. Ось як зробити його трохи менше blecch-y (але все-таки blecch-y, тим не менш, ви можете набагато менший на платформі HP. Але я відволікаюся ...) Цим я маю на увазі, встановлюйте лише ті компоненти, необхідні для управління сховищем на вашій машині .

До речі, пряма відповідь на запитання користувача полягає в пункті "Показати фізичні диски на vdisk 0" у списку нижче.

wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices

Додати до .bashrc кореня:

export PATH=$PATH:/opt/dell/srvadmin/bin

Насолоджуйтесь:

Команди RAID

  • Показати всі фізичні диски на контролері 0

    $ omreport storage pdisk controller=0
    
  • Показати всі логічні диски на контролері 0

    $ omreport storage vdisk controller=0
    
  • Показати всі фізичні диски на vdisk 0

    $ omreport storage pdisk controller=0 vdisk=0
    
  • Переконфігуруйте vdisk для raid1 з raid0 ( COOL !!!! )

    $ sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
    
  • Створіть vdisk на новому диску:

    $ sudo omconfig storage controller controller=0 action=clearforeignconfig
    $ sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
    

Більше інформації

До речі, оскільки це не що інше, як карта LSI MegaCLI від фірми Dell, відповідь Хана Соло може бути ще кращою! Я все ще повинен спробувати це.

Солодкість

Ось приклад виходу мережевого транспорту, прокладеного через grep для смачного набору даних:

$ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root

Controller PERC H700 Integrated (Embedded)
ID                              : 0:0:0
Status                          : Ok
Name                            : Physical Disk 0:0:0
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFDT
Part Number                     : CN0X162K7262213800JTA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E44C5

ID                              : 0:0:1
Status                          : Ok
Name                            : Physical Disk 0:0:1
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFEY
Part Number                     : CN0X162K7262213800FPA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E3C1D

@slm Що стосується вашої редакції - чи справді вона працює без кореня? У мене немає мереж / omconfig перед собою сьогодні, але я не впевнений, що будь-який користувач може просто створити vdisk. '$' У командному рядку має на увазі звичайного користувача, а не root.
Майк S

Так, я це робив днями, коли я мав справу з Dell 730, всі cmds, за винятком тих 2, які "створюють", не потребували root, я виправлю.
slm

6

Я також намагався змусити його працювати в CentOS, і я знайшов тут робочий пакет http://mirror.ndchost.com/software/lsi/

називається " MegaCli-8.07.10-1.noarch.rpm "

Посилання команди http://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS

Я сподіваюся, що це допомагає.


1
Я б абсолютно погодився, використовую / opt / megacli / MegaCli64 -PDList -aALL | grep -я прошивка, і вона підкаже, чи нормальні фізичні диски. (Команда від erikimh.com/megacli-cheatsheet - дивіться, чи використовував я неправильну). По суті, догляд за рейдом виконує велику роботу з моніторингу дисків, тому просто слідкуйте за його думкою про діючі стани дисків.
Деякий Linux Nerd

3
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
Device: FUJITSU  MBE2147RC        Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:

8
Розгляньте, будь ласка, читаючи Як написати гарну відповідь? у нашому довідковому центрі, а потім переглянути відповідь. Ваша команда технічно може бути рішенням, про яке також було сказано в інших, набагато старших відповідях, і деякі пояснення вітаються. Заздалегідь спасибі.
HBruijn

1
В іншій відповіді було використано "sat + megaraid", що не працювало для мене. (Правильно, я не знав добре команду smartctl і не знав, як змінити команду, щоб вона працювала.) Ця відповідь привела мене до правильного шляху, і це працює для мене.
Yongwei Wu

1

perccliКоманда може також показати вам багато інформації диска , якщо ви запитаєте його красиво:

# /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
Controller = 0
Status = Success
Description = Show Drive Information Succeeded.


Drive /c0/e32/s0 :
================

-------------------------------------------------------------------------
EID:Slt DID State DG       Size Intf Med SED PI SeSz Model            Sp
-------------------------------------------------------------------------
32:0      0 UGood -  278.875 GB SAS  HDD N   N  512B ST3300657SS      U
-------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded


Drive /c0/e32/s0 - Detailed Information :
=======================================

Drive /c0/e32/s0 State :
======================
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature =  40C (104.00 F)
Predictive Failure Count = 1
S.M.A.R.T alert flagged by drive = Yes

Це потрібно повторити для кожного слота для корпусу, або, принаймні, я не знайшов способу надрукувати все це за допомогою однієї perccliкоманди.

Його також легко встановити порівняно з іншими, більш комплексними параметрами:

# curl -C - -O 'https://downloads.dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
# tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
# cd Linux/
# yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
# cd /opt/MegaRAID/perccli/

perccliце НЕ повний набір моніторингу як Delll OMSA, але це звучить як багато людей не хочуть - то всеосяжне і замість цього потрібен пристойний, простого інструменту.


-1

Привіт У мене є аналогічна карта Dell PERC / LSI, і мені потрібно було перевірити статус RAID. У LSI є утиліта під назвою sas2ircu, яку я вважав досить корисною, є також версія для Windows та Linux.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.