Нещодавно використання CPU для двигуна на двох наших пілінг-роутерах Juniper зросло з ~ 10-20% середнього навантаження до 80 +%. Я намагаюся розібратися, що це спричиняє (і як повернути це велике навантаження).
Деяка інформація про маршрутизатори: обидва запускають одну і ту ж версію JunOS, обидві підключені до одних і тих самих двояких однорідних локальних мереж IXP і мають велику кількість (кілька сотень) (майже однакових) сеансів IPv4 та IPv6. Обидва маршрутизатори мають підключення до іншого постачальника послуг IP-транзиту і підключені однаково до решти нашої мережі. Навантаження процесора на двигунах маршрутизації не є рівним на 80 +%, падіння повертається до нормального рівня за хвилини до години, але ці падіння трапляються не так часто.
Що я перевірив:
- в момент початку збільшення не було змінено конфігурацію
- не збільшується неодноразовий трафік, спрямований на площину управління
- немає (суттєвої) зміни кількості переданого трафіку (хоча навіть збільшення не має значення)
show system processes summary
вказує на те, щоrpd
процес викликає велике навантаження процесора- не спостерігається швидкого плескання однолітків BGP, що спричиняє велику кількість змін BGP
Одне з можливих пояснень, які я можу придумати, - це одноранговий (або більше ніж один) один із обох маршрутизаторів IXP, підключений до надсилання великої кількості оновлень BGP. Наразі у мене є лише статистика щодо кількості повідомлень BGP для моїх транзитних сеансів (не показує аномальної активності), а з декількома сотнями сеансів BGP в рівних локальних мережах не так просто визначити проблемні сесії, якщо я повинен створити графіки для всі сеанси.
Мої запитання:
- Чи є ще якісь речі, які я повинен перевірити, щоб знайти причину цього збільшення завантаження процесора на двигунах маршрутизації?
- як я можу легко дізнатися, які сеанси викликають ці проблеми (якщо моє припущення правильно)? Увімкнення трасеопцій BGP генерує величезну кількість даних, але я не впевнений, чи він дає мені реальну інформацію.