У мене є сервер Dell 1U з процесором Intel (R) Xeon (R) L5420 @ 2,50 ГГц, 8 ядрами, що працюють на ядрах Ubuntu Server 3.13.0-32-generic на x86_64. Він має подвійні мережеві карти 1000baseT. У мене він налаштований для пересилання пакетів від eth0 до eth1.
Я помітив, що в моєму файлі kern.log він постійно висить, а потім відпочиває. Це трапляється часто. Це відбувається кожні кілька секунд, то, можливо, це буде нормально протягом декількох хвилин, а потім назад кожні кілька секунд.
Ось дамп файлу журналу:
[118943.768245] e1000e 0000:00:19.0 eth0: Detected Hardware Unit Hang:
[118943.768245] TDH <45>
[118943.768245] TDT <50>
[118943.768245] next_to_use <50>
[118943.768245] next_to_clean <43>
[118943.768245] buffer_info[next_to_clean]:
[118943.768245] time_stamp <101c48d04>
[118943.768245] next_to_watch <45>
[118943.768245] jiffies <101c4970f>
[118943.768245] next_to_watch.status <0>
[118943.768245] MAC Status <80283>
[118943.768245] PHY Status <792d>
[118943.768245] PHY 1000BASE-T Status <7800>
[118943.768245] PHY Extended Status <3000>
[118943.768245] PCI Status <10>
[118944.780015] e1000e 0000:00:19.0 eth0: Reset adapter unexpectedly
Ось інформація з ethtool:
Налаштування:
Settings for eth0:
Supported ports: [ TP ]
Supported link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Supported pause frame use: No
Supports auto-negotiation: Yes
Advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Advertised pause frame use: No
Advertised auto-negotiation: Yes
Speed: 1000Mb/s
Duplex: Full
Port: Twisted Pair
PHYAD: 1
Transceiver: internal
Auto-negotiation: on
MDI-X: off (auto)
Supports Wake-on: pumbg
Wake-on: g
Current message level: 0x00000007 (7)
drv probe link
Link detected: yes
Інформація про водія:
ethtool -i eth0
driver: e1000e
version: 2.3.2-k
firmware-version: 1.4-0
bus-info: 0000:00:19.0
supports-statistics: yes
supports-test: yes
supports-eeprom-access: yes
supports-register-dump: yes
supports-priv-flags: no
Що може бути причиною цього? Це лише помилка в програмному забезпеченні або актуальна проблема з обладнанням? Я бачив багато інших, які мають подібні проблеми, але не мають реального рішення, і це також змушує мене вважати, що це проблема програмного забезпечення?
Можливо, хтось може пролити на мене щось світло?