В ідеалі, з максимально простим встановленням і без необхідності перезавантаження серверів. Здебільшого, DL380 G5's
якщо це допомагає.
В ідеалі, з максимально простим встановленням і без необхідності перезавантаження серверів. Здебільшого, DL380 G5's
якщо це допомагає.
Відповіді:
Це трохи залежить від операційних систем, на яких ви працюєте на серверах, але в цілому можна отримати сповіщення від серверів HP ProLiant та контролерів RAID Smart Array RAID.
Повний список драйверів та програмної підтримки для ваших систем DL380 G5 наведено тут .
SNMP та рішення для моніторингу - найкращий підхід ... Але ви можете доповнити це деякими інструментами HP. HP пропонує HP System Insight Manager , який доступний для завантаження, а також постачається із серверами. Це ідеально підходить для колекцій серверів. Якщо ви шукаєте одноразові сповіщення, не будуючи інфраструктуру управління або моніторингу, ви можете просто встановити агенти управління HP (він же ProLiant Pack Pack ).
У автономних системах Linux агенти надсилають пастки електронною поштою. Зазвичай я налаштовую пакет підтримки за замовчуванням або спеціальний пакет , після чого відредагую /opt/hp/hp-snmp-agents/cma.conf
та змінюю trapemail
рядок, щоб вказати адресу одержувача:
########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
# trapemail /usr/bin/logger
# will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' systems@1234.net
Якщо ви працюєте з Linux і не хочете встановлювати повний пакет управління HP, ви можете розробити сценарій навколо утиліти cciss_vol_status для запиту контролера / стану диска. Також дивіться: Встановлення агентів HP на OpenFiler
ProLiant DL360 G7
серверів, і HP SIM налаштовано для моніторингу.
Ознайомтеся з HP Insight Manager
https://www.hpe.com/us/en/product-catalog/detail/pip.489496.html#
Я вважаю, що це має працювати з вашими серверами.
Я використовував легку програму, яку @ewwite згадував у своїй відповіді: cciss_vol_status
Якщо ви дотримуєтесь супровідних інструкцій INSTALL, сценарій розміщується в /usr/local/bin/cciss_vol_status
.
Ось скрипт для обгортки, який я використовую для отримання даних про cciss_vol_status, і надіслати електронний лист, якщо будь-який масив має статус НЕВЕРШЕНО.
#!/bin/bash
#
# Check status of RAID volumes on HP Smart Array controllers. Send an email
# alert if any volumes have a FAILED status.
#
status=`/usr/local/bin/cciss_vol_status /dev/sd*`
# email lock file
lockfile=/tmp/raid.check.hp.smartarray.lock
# how often to send an email (minutes)
_notification_freq=59
_host=`hostname`
# To: email
_toemail=root
# create email lock file
[ ! -f ${lockfile} ] && /bin/touch ${lockfile}
if echo $status | grep -q FAILED
then
# make sure we haven't sent a notification in the last X minutes
if test `find ${lockfile} -mmin +${_notification_freq}`
then
echo -e "${status}" | /bin/mail -s "System Alert! RAID failure on ${_host}" ${_toemail}
# update lock file mod time
/bin/touch ${lockfile}
fi
fi
Викличте вищезгаданий скрипт у cron. Я запускаю чек кожні дві хвилини:
*/2 * * * * /usr/local/bin/raid.check.hp.smartarray.sh
Ми використовуємо HP System Insight Manager, щоб перевірити, чи працюють наші HP, але нічого іншого, крім цього. Я виявив, що агент Linux є непосильним для нас, оскільки у нас є інші моніторингові рішення, тому цей вищезазначений сценарій добре виконує свою конкретну мету.
ОНОВЛЕННЯ
Просто порада щодо усунення несправностей у випадку, якщо ви стикаєтеся з цим. Цей скрипт виявився корисним сьогодні вранці, коли мені надійшло повідомлення про невдалий масив із:
Досягнуто брудного обмеження кешу
Пристрій перейшов лише для читання і не був видно в /proc/partitions
. Я перезавантажив сервер і побачив ці повідомлення під час завантаження:
Логічні накопичувачі відключені через можливу втрату даних. Виберіть "F1", щоб продовжити вимкнення логічних накопичувачів. Виберіть "F2", щоб прийняти втрату даних та знову ввімкнути логічні накопичувачі
Я вибрав F2, і RAID був чудовим і встановлений на завантаженні.
встановити smartmontools. Електронна пошта, що передує, перед тим, як вийде з ладу.