Як * Ви * відстежувати та документувати регулярне обслуговування?


10

Яке програмне забезпечення чи система ви не користуєтесь помилками сервера, щоб нагадати вам робити звичайне обслуговування? Як ви переглядаєте та реєструєте різні елементи, які ви хочете перевірити? Чи є у вас документ про внутрішній процес? Чи є у вас щотижнева електронна пошта з нагадуванням для перевірки системних журналів?

Крім того, чи працюєте ви над командою, яка займається обслуговуванням системи, і якщо так, то як ви координуєте, хто буде робити яке технічне обслуговування?

Якщо ви використовуєте систему відстеження помилок / проблем для введення завдань, чи є у вас завдання Cron, щоб ввести повторювані завдання?

Відповіді:


5

Зараз я використовую програму відстеження запитів ( http://www.bestpractical.com/rt )
Усі події технічного обслуговування отримують пов'язаний квиток у черзі "системи". Примітки щодо проблем, які виникали, хто робив роботу, коли тощо, все вноситься до квитка разом з необхідними схваленнями.

Наразі наші повторювані завдання (щоквартальне виправлення тощо) створюються вручну, але їх можна автоматизувати досить легко (робота з кроном + електронна пошта).

Координація того, хто робить роботу, для нас відносно проста, оскільки в нашій групі адміністратора є лише 2 людини, але, коли ми розширюємо план, це створити головний квиток на заходи з обслуговування та використовувати дитячі квитки, призначені відповідальним сторонам для делегування роботи. .


Щоденні речі (перевірки журналу тощо) - інша справа: я все це вирішував в автоматизованих процесах:

  • InterMapper слідкує за загальним статусом серверів (SNMP-запити, які шукають велику завантаженість, низький простір на диску тощо), функціональністю наших веб-інтерфейсів та різноманітними іншими речами, які можуть вказувати на проблеми.
  • Syslog-NG збирає журнали від наших хостів і подає їх через купу сценаріїв, які перевіряють наявність очевидних негараздів. Я періодично кидаю погляд на колоди, щоб перевірити сценарії, але це регулярно не планується.


2

Належним чином впроваджена автоматизація взагалі усуває необхідність виконання завдань і контрольних списків. Чому ви вручну хочете перевірити речі, коли у вас є комп'ютери, які можуть виконувати цю роботу набагато ефективніше та ефективніше?

Все, що потребує періодичної перевірки, перевіряється системою моніторингу. Планові завдання автоматизовані, коли це практично, і нагадування надсилаються для тих небагатьох завдань, які потрібно виконати вручну. Документація - це інша справа, але зроблено правильно, коли комп'ютери можуть створювати свою документацію.

Перестаньте шукати кращих ручних способів і починайте шукати кращі автоматизовані способи виконання будь-якої роботи. Комп'ютери є для того, щоб працювати на нас, а не ми для них.


Добре правило: Сисадмін повинен бути завжди грамотним і ледачим. Бажання не займатися роботою призведе до хороших сисадмінів для впровадження хорошої автоматизації.
voretaq7

Дозвольте навести конкретний приклад: мені потрібно стежити за виправленнями безпеки для Apache, а потім генерувати нову збірку та перевірити її, коли вийде патч. Рутинна частина - моніторинг нового випуску Apache. Неможливо просто оновити безпосередньо з (головного) сховища, оскільки в ньому не будуть складені правильні модулі. Також потрібно провести аудит, щоб переконатися, що випуски перевірені. Це має більше сенсу?
Зак

Крім того, я не хочу просто прокручувати останню партію будь-якого програмного забезпечення, поки збірка не пройшла QA. Значна частина контролю якості автоматизована, але не всі.
Зак

І чи є причина, яку не вдається все написати? Автоматизовані перевірки оновлень, надсилання повідомлень, коли такі доступні, з подальшим сценарієм компіляції та встановлення, готових до тестування. Нехай машина виконає основну частину роботи і повідомить вам, коли вам потрібна ваша увага.
Джон Гарденєр

1

Для роботи над проектом його випускають із програми Project Management (електронна пошта та календар, інтегрований із можливістю документувати детальну роботу та планувати її для конкретних людей).

Для обслуговування, оновлення, виправлень тощо, у нас є система квитків, яка більш-менш інтегрується з нашим процесом управління змінами для обробки запитів та планування.

Для повністю керованої внутрішньою роботою та роботи на довгих циклах (щоквартально, щорічно тощо):

Нагадування, що потрібно робити, є календарем. Існує неформальна / напівформальна документація ("вікі") щодо загального розкладу.

Існує деяка кількість "як" та процедурна документація щодо виконання завдань і доступна для команди в цілому, але люди мають власні адміністративні "чорні книги" та журнали із замітками та рецептами.


1

Система моніторингу може допомогти у таких випадках:

  • Ми документуємо кожен раунд щомісячного обслуговування у текстовому файлі doc з відмітними полями. Щомісяця ми зберігаємо звіт у папці нашого NAS. Ми відстежуємо мінімальний вік файлу. Якщо мінімальний вік файлу вище 40 днів, ми отримуємо сигнал тривоги.

  • Однією з частин нашого регулярного обслуговування є перезавантаження вибраних серверів та приладів раз на місяць. Ми використовуємо датчики "тривалості роботи в системі" (SNMP / WMI) у нашому програмному забезпеченні для моніторингу, і якщо час роботи понад 40 днів, ми отримуємо сигнал тривоги.

  • Для резервного копіювання ми відстежуємо мінімальний вік файлу в папці резервного копіювання кожного сервера в нашій NAS. Якщо мінімальний вік файлу вище 10 днів, ми отримуємо сигнал тривоги.


1

Я використовую Checkpanel ( https://checkpanel.com ) для управління своїми завданнями з технічного обслуговування, що повторюються. Він пропонує контрольні списки для багаторазового використання та простий інтерфейс для реєстрації результатів кожної перевірки.

Після перевірки товару він не просто "готовий", але залишається доступним для подальших перевірок. Кожна перевірка записується так, що ви можете легко переглянути історію всіх попередніх перевірок товару, включаючи необов'язкові деталі (наприклад, повідомлення про помилку за невдалої перевірки).

Ви можете встановити повторюваний кожен предмет, щоб переконатися, що ви перевіряєте його принаймні раз на тиждень / кожні 2 дні / тощо. Існує консолідований вигляд усіх належних елементів. Якщо ви хочете, ви також можете отримувати щоденний електронний лист із усіма належними предметами.

Існує шаблон контрольних списків обслуговування сервера, який ви можете використовувати як основу для власних контрольних списків. Інші шаблони включають контрольні списки веб-додатків, WordPress тощо.

Розкриття інформації: Я засновник Checkpanel.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.