Минулого тижня у нас відбувся досить серйозний збій, який вплинув на декілька послуг, які вивели нас із СРС з клієнтами. Тепер, коли все вирішено, я проводжу посмертний огляд.
З цього огляду я хотів би створити внутрішній документ, який описує відключення, його наслідки, нашу реакцію та резолюцію. Я хочу придумати досить стандартну форму для подальшого використання. Я включив свої думки нижче, але які ще елементи слід включити? Якби це інцидент із безпекою, що ви додали б?
- Підсумок Підсумок події на виконавчому рівні.
- Порушені послуги
- Вплив Який вплив був на наших користувачів та угод про надання послуг за угодою про рівень обслуговування (SLAs)? Чи були кошти в доларовому вираженні, пропущені транзакції, втрачені клієнти тощо?
- Тривалість відключення для кожної постраждалої послуги, якщо були розбіжності
- Причина Включаючи первинні та вторинні причини
- Дозвіл
- Хронологія подій Повідомлення, контакт із зовнішніми постачальниками, сповіщення клієнтів, відповіді тощо.
- Проблеми з нашою реакцією. Чи не все пішло так, як було заплановано з нашою реакцією на відключення? Правильні сповіщені люди? Чи виконавці виконували свої договірні зобов’язання?
- Профілактичні заходи, які потрібно вжити, як не допустити повторного відключення або зменшити його вплив?
- Метод виявлення Наскільки добре ми виявили цей збій і як покращити виявлення в майбутньому?
- Зміни, які можна внести у відповідь на відключення в майбутньому
Постарайтеся, щоб публікації не були одними питаннями та поясненнями, і цю публікацію можна буде оновити з голосовими відповідями.