Час від часу я хочу зібрати діапазони CIDR з моїх файлів журналу Apache. Це легко для діапазонів, які падають на природні межі (/ 8, / 16 і / 24), але не так просто для інших діапазонів, таких як / 17 і / 25.
Приклади:
# 192.168.0.0/16: (easy)
grep " 192\.168\." access_log
# 192.168.128.0/17: (more thought required)
grep -E " 192\.168\.(12[89]|1[3-9][0-9]|2[0-5][0-9])\." access_log
# 192.168.0.0/17: (more thought required)
grep -E " 192\.168\.([0-9]|[0-9][0-9]|1[01][0-9]|12[0-7])\." access_log
# 192.168.128.0/18: (straining my brain)
grep -E " 192\.168\.(1[2-8][0-9]|19[01])\." access_log
Ці реджекси ігнорують IP-адреси, які містять провідні нулі, наприклад 192.168.001.001
, що не є проблемою в файлах журналу Apache, але може бути в інших файлах журналу. Зокрема, принтерам подобаються провідні нулі. Досить просто додати необов'язкові нулі до регулярного виразу, але це просто ускладнить все. Має бути простіший спосіб.
Чи є простий спосіб вибрати рядки з файлу, які відповідають будь-якому діапазону CIDR?
Фантазійні розширення для регулярних виразів будуть розглянуті, як і різні інструменти (наприклад, awk
або perl
якщо це необхідно, але я хочу, щоб це було одне вкладиш), якщо вони полегшать роботу. В ідеалі те, що мені хотілося б, щось таке
grep "[:CIDR 192.168.128.0/18:]" access_log
Інструмент, який перетворює діапазон CIDR у відповідний регулярний вираз, також буде добре.
$ cidr2regex 192.168.0.0/18
192\.168\.(1[2-8][0-9]|19[01])\.[0-9]{1,3}
або
$ grep -E "$(cidr2regex 192.168.0.0/18)" access_log
Бонусні бали, якщо ваша відповідь також охоплює IPv6.