Що спричиняє падіння загального виходу на інтерфейсі комутатора Cisco?


16

У мене лезо шасі HP c7000, яке містить перемикачі Cisco 3120X та Cisco 3120G, що працюють на ios 12.2 (58) SE1. Самі лопаті дуже легкі, але багато інтерфейсів на різних лопаткових вимикачах в шасі демонструють досить високу кількість падінь на виході. Якщо я перевіряю кількість крапель виходу неодноразово, я бачу не тільки збільшення лічильника, але іноді воно зменшується. Цифри не співвідносяться з пакетами / записаними в інтерфейсі. Налаштування QoS є платформою за замовчуванням.

Наступні зразки були взяті протягом 30 секунд:

bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску: 2255550
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску: 2255550
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску: 2255550
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску: 2255550
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску: 2255550
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску: 2255550
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску продукції: 451110
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску продукції: 451110
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску продукції: 902220
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску продукції: 1353330
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску продукції: 1804440
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску продукції: 1804440
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску продукції: 1804440
bc1019-3120-stack> sh int gi2 / 0/7 | я випадаю краплі
  Черга на введення: 0/75/0/0 (розмір / макс / краплі / промивки); Загальний падіння випуску продукції: 451490

bc1019-3120-stack> sh int gi2 / 0/7 | i вихідна норма
  5 хвилинна швидкість виходу 301000 біт / сек, 119 пакетів / сек

1) Чи є ще щось, що може спричинити падіння виходу, крім того, що сервер нік не отримує кадри досить швидко?

2) Яка максимальна кількість вихідних крапель може записувати лічильник інтерфейсів? Він перекидається, коли досягає максимуму?

3) Що б вважалося здоровим показником падіння випуску?


Як зазначив Леонардо Абдалла, помилкові падіння виходу, помічені на шасі леза, є результатом помилки CSCtq86186
User123456

Це помилка. Ми потрапили на те саме, оновлене до c3750e-universalk9-mz.150-2.SE4.bin і все добре. JB

Відповіді:


14

Якщо хтось не очищає лічильники, ви ніколи не бачите жодних лічильників типу одометра (тих, які збільшуються на основі дії пакету) зменшуються, вони завжди повинні збільшуватися. Ця частина звучить як помилка.

Що стосується того, що, зокрема, спричиняє падіння випуску продукції, існує стільки різних причин, що точно визначити це дуже важко. Іноді на задній площині комутатора виникають затори, і вони можуть відображатися як падіння виходу на вихідному інтерфейсі. У рідкісних обставинах ви також можете отримати мікроскопи, які не з’являються при опитуванні через 1-хвилинний інтервал, який швидко перевантажує інтерфейс, але потім дуже швидко відкидається назад. Я б запропонував захопити SNMP OID для виведення крапель, а потім скласти графік і побачити, як він відповідає лічильнику CLI.

Взагалі кажучи, ви не бажаєте жодних крапель виводу, оскільки вони вказують на пакет, який не зробив його до місця призначення. Але, якщо ви посилаєтесь гарячими посиланнями (які, на вашу думку, ви не хочете), вони певною мірою неминучі, в основному через буферизацію внутрішніх комутаторів тощо


Мені цікаво, чи в такому випадку стільки випадаючих, лічильники обертаються.
NOS

1
Вони є 32-бітовими лічильниками, тому ви нікуди не доходите до меж. (і, можливо, внутрішньо 64-бітний)
Рікі Бім

8

Моя перша думка - це одноманітне затоплення, особливо якщо лічильники зростають в унісон через декілька портів в одному влані. Я погоджуюся з Аароном, що декрементація лічильника звучить як помилка. Лічильник, ймовірно, перевернеться на 2 ^ 64, але це не відбудеться протягом декількох секунд. Я вважаю б здоровий показник падіння випуску рівним нулю, але це нереально - навіть у центрі обробки даних. Ви робите 10G uplinks?


Так, один 10-кілограмовий висхідний канал від кожного з двох 3120X в шасі леза (один порт заблокований через stp)
User123456

Так само, як 1G висхідна лінія легко перекриє 100M низхідній лінії зв'язку, я впевнений, що це стосується 10G / 1G. Це особливо актуально, коли відбувається одноманітне затоплення. Я сумніваюся, що одностатеве затоплення буде очевидним у статистиці пропускної здатності / pps.
Денніс Олвані

5

Схоже, ви потрапляєте у помилку CSCtq86186. Ця помилка була виявлена ​​в 3750-х, 2960-х роках, але це може вплинути і на лезові перемикачі.


Ось саме ця помилка потрапляє в наші 3120-ті - виправлена ​​в 15,0 (2) SE. Спасибі!
Користувач123456

4

Якщо у вас спостерігається однонакісне затоплення, запуск проводів на одному з хостів або охоплює один з портів це повинно показувати досить швидко.

Це здається, що у вас є зайві ядра в квадратній топології? Якщо так, спробуйте додати цю команду до інтерфейсу vlan:

arp timeout 300

CAM таблиці зберігають записи протягом 5 хвилин, тоді як таблиці ARP зберігаються протягом чотирьох годин (за замовчуванням). Встановлення ARP у відповідність із CAM може усунути єдине затоплення за рахунок незначного збільшення CPU. Catalyst 6500/6000 Перемикає Проблеми з таблицею ARP або CAM Виправлення неполадок


1

Краплі на виході є досить поширеними на менших комутаторах з невеликими буферами, оскільки будь-який пакет може вичерпати буфер. Я не дуже знайомий з 3120, тому я не можу говорити за розміром буфера, але, принаймні, це є загальною причиною, поки можна було отримати краплі виходу.

Конкретні причини - блокування заголовків лінії (HOLB), де кілька портів джерела надсилаються до одного пункту призначення, і тому ми отримуємо затори. Ще одна поширена причина - це перехід від більш високої швидкості до порту до нижчої, тобто 10G до 1G або 40G до 10G.

Рекомендую запустити контролери показувати ethernet-контролер X, де X - ваш порт. Ви повинні отримати деяку інформацію щодо падіння виходу, наприклад, якщо щось намагається вивести на великі кадри, що може статися, якщо у вас немає постійної MTU у вашій мережі.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.