Проведення аналізу причин


9

Хочу дізнатися більше про те, як провести аналіз корінних причин. Більше разів наш відділ каже користувачеві спробувати перезавантажити систему (їх система Windows XP), що фактично «усуває» чимало проблем. Коли я поспішаю (а іноді і отримую оплату щогодини, це сприяє цьому), я можу спробувати знайти вирішення, щоб швидко вирішити проблему, а не робити аналіз першопричини.

Більшу частину часу я шукаю файли журналів або переглядач подій для цієї інформації. Іноді я буду використовувати інструменти Sysinternals або інколи запускати sniffer пакетів. Я, мабуть, не використовую програми Sysinternals настільки, наскільки я повинен. Деякі конкретні відомості про те, як ви користуєтесь цими інструментами, коли і чому також будуть корисними.

Я знаю, що це широко відкрите питання, але чи можете ви, будь ласка, коротко пояснити свою методологію, інструменти тощо, якими ви користуєтесь? Схоже, що багато адміністраторів SF використовують більш поглиблений процес, про який я хотів би дізнатися більше. Якщо це допоможе звузити будь-яке питання, мене найбільше зацікавлять інструменти, поради, підказки тощо, що стосуються серверів та клієнтів Windows у середовищі AD.

Відповіді:


5

Виявлення першопричини проблеми залежить від проблеми - Ваш початковий інстинкт переглядати файли журналів / інструменти sysinternals / сніфери пакетів, як правило, правильний.
Я б додав запуск засобу для видалення зловмисного програмного забезпечення MS та гарну програму AV для систем Windows (і гарантую, що у них немає чогось типу CyberDefender чи іншого програмного забезпечення AV-trojan.

Люди на біржі стека є прихильниками методу "5 Whys" ( http://en.wikipedia.org/wiki/5_Whys , також цей хороший короткий PDF-файл, який показує його в дії ). Це досить цінний інструмент для аналізу першопричин.


Крім цього я намалюю дві широкі категорії та деякі питання, які я зазвичай задаю / те, що я перевіряю:

Таємнича поведінка, не пов’язана з мережею,
наприклад, "Слово постійно на мене"

Основні запитання:

  1. Що змінилося?
    (Не приймайте "нічого" за відповідь - це перша брехня. Нове програмне забезпечення, патчі та інше все.)
  2. Що ви робили, коли у вас були проблеми?
    (Спробуйте витягнути тут якомога більше деталей - у моєму прикладі вище "Я натискаю клавішу швидкої клавіші для вставки ініціалів і програма вийшла з ладу ")
  3. Це колись працювало раніше?
    (Якщо так, почніть переглядати речі з (1) вище)
  4. Чи можете ви відтворити проблему у вашій системі?
    (Якщо так, це хороший знак: Виклик технічної підтримки постачальнику може допомогти. Якщо ні, вам не потрібно буде переглянути систему користувача для решти цих питань.)
  5. Чим відрізняється середовище користувача, ніж ваше середовище?
  6. Чи є підозрюваний апаратний засіб користувача (виконати тест пам'яті, шукати помилки SMART на жорсткому диску тощо)
  7. Якщо ви до цього зайшли (перевірка апаратного забезпечення, перевірка програмного забезпечення, відсутні віруси, зловмисне програмне забезпечення), відвідайте користувача на день. Дотримуйтесь своїх трудових звичок.
    У моїй компанії колись було таємниче заблокування системи, яке стосувалося клацання миші на певній частоті (Ми досі не знаємо чому, але нам довелося спостерігати за тим, як користувач це робить і практикує протягом дня, щоб мати можливість відтворити надійно)

Проблеми, пов’язані з мережею

Дуже багато подібного, але з деякими більш конкретними вказівками.

  1. Що змінилося?
    (Так, ти завжди починаєш там)
  2. Що порушено?
    • Чи можете ви перейти на веб-сторінки? Це тільки один, який вниз? Якщо так, це вниз для всіх або тільки для вас ?
    • Чи можете ви пінг речі в Інтернеті по імені?
      Як щодо IP? Наскільки далеко потрапляє мікроканал?
  3. Коли вона порушена?
    • Завжди в один і той же час дня?
    • На короткий період кожні N днів?
    • Випадково (це дійсно випадково? Накресліть його на календарі ...)
  4. Чи є щось дивне у віддаленому сайті?
    • Подивіться на DNS - Якщо це обертів, там може бути поломка на віддаленій стороні
    • Ми говоримо про інший кінець VPN? Що з VPN (журнали!)?
  5. Чи є щось дивне в місцевому сайті?
    • Перевірте свій локальний брандмауер
    • Перевірте будь-яке "програмне забезпечення для фільтрування"
  6. Зверніться до свого провайдера, щоб дізнатися, чи є якісь відомі проблеми
  7. Перевірте такі сайти, як http://www.internetpulse.net/, на предмет відомих проблем у мережі
  8. Перевірте машину користувача
    (налаштування TCP тощо. - Зазвичай це не проблема, але іноді.)

1

На додаток до відмінних відповідей, я додам:

  • Визначте дату / час початку випуску. Це може здатися очевидним, але я бачив занадто багато питань, де це не було задокументовано, а пізніше були зроблені невірні припущення. Це добре співвідноситься з кроком "що змінилося".

  • Чи питання може бути відтвореним чи переривчастим? Це вкрай важливо, оскільки відтворювані симптоми набагато простіше та швидше вирішити, ніж ті, що є переривчастими. Якщо він відтворюється, переконайтеся, що етапи задокументовані.

  • Визначте симптом (и). Зауважимо, що ми розрізняємо "симптом", який є проявом першопричини, та фактичну проблему / першопричину.

    1. Чи є інші види діяльності, які можуть відтворити симптом?
    2. Які ще симптоми є?
    3. Якщо проблема переривчаста, чи можемо ми виявити діяльність, яка спричинить її виникнення?
    4. За яких обставин можна запобігти появі симптому? Чи виникає проблема лише при вході в систему за допомогою мережевого облікового запису, але працює нормально, якщо ви входите на локальному рівні? Чи виникає проблема, коли ви входите в систему як звичайний користувач, але чи працює нормально, якщо ви входите з підвищеними привілеями? Це трапляється лише в одній системі, але інша система, яка має бути подібною, не виявляє симптому?
  • Локалізуйте проблему на ймовірно несправній функціональній складовій. Якщо у веб-додатку є помилка, чи це в коді програми, веб-сервері, операційній системі, що розміщує веб-сервер, мережу чи віддалений кінець? Наразі це найкраще здогадатися, щоб ресурси були зосереджені на ймовірній причині, тому переконайтеся, що інші знають, що це теорія / домисловість.

  • Сумнівте свої припущення та спробуйте зібрати емпіричні дані для підтримки припущень та висновків. Дуже погано почуватись казати комусь, що немає проблеми з x, і пізніше виявлено, що існує насправді. Зазвичай, коли є неправильне рішення, могли бути дані для підтримки правильного рішення.


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.