Регулярне вираження, що відповідає дійсним IPv6 адресам


111

У мене виникають проблеми з написанням регулярного виразу, що відповідає дійсним IPv6-адресам, включаючи їх у стисненому вигляді (із ::або провідними нулями, опущеними з кожної пари байтів).

Чи може хтось запропонувати регулярний вираз, який би відповідав вимозі?

Я розглядаю можливість розширення кожної пари байтів і порівняння результату з більш простим регулярним виразом.


1
Перевірте intermapper.com/ipv6validator .. вона посилається на цей скрипт тесту perl
Mottie

Я спробував усі відповіді нижче, і вони не працюють для всіх моїх тестових випадків та / або вони також включають IPv4, про який не вимагали. Я знайшов , що це чистісінький рішення до сих пір: stackoverflow.com/a/21944928/3112803
gfrobenius

Відповіді:


252

Мені не вдалося отримати відповідь @Factor Mystic на роботу з регулярними виразами POSIX, тому я написав такий, який працює з регулярними виразами POSIX та регулярними виразами PERL.

Він повинен відповідати:

Регулярне вираження IPv6:

(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))

Для зручності читання наведено вище регулярний вираз, розділений на основні точки АБО на окремі рядки:

# IPv6 RegEx
(
([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|          # 1:2:3:4:5:6:7:8
([0-9a-fA-F]{1,4}:){1,7}:|                         # 1::                              1:2:3:4:5:6:7::
([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|         # 1::8             1:2:3:4:5:6::8  1:2:3:4:5:6::8
([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|  # 1::7:8           1:2:3:4:5::7:8  1:2:3:4:5::8
([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|  # 1::6:7:8         1:2:3:4::6:7:8  1:2:3:4::8
([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|  # 1::5:6:7:8       1:2:3::5:6:7:8  1:2:3::8
([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|  # 1::4:5:6:7:8     1:2::4:5:6:7:8  1:2::8
[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|       # 1::3:4:5:6:7:8   1::3:4:5:6:7:8  1::8  
:((:[0-9a-fA-F]{1,4}){1,7}|:)|                     # ::2:3:4:5:6:7:8  ::2:3:4:5:6:7:8 ::8       ::     
fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|     # fe80::7:8%eth0   fe80::7:8%1     (link-local IPv6 addresses with zone index)
::(ffff(:0{1,4}){0,1}:){0,1}
((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}
(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|          # ::255.255.255.255   ::ffff:255.255.255.255  ::ffff:0:255.255.255.255  (IPv4-mapped IPv6 addresses and IPv4-translated addresses)
([0-9a-fA-F]{1,4}:){1,4}:
((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}
(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])           # 2001:db8:3:4::192.0.2.33  64:ff9b::192.0.2.33 (IPv4-Embedded IPv6 Address)
)

# IPv4 RegEx
((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])

Щоб полегшити розуміння вищезазначеного, наступний "псевдо" код повторює вище:

IPV4SEG  = (25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])
IPV4ADDR = (IPV4SEG\.){3,3}IPV4SEG
IPV6SEG  = [0-9a-fA-F]{1,4}
IPV6ADDR = (
           (IPV6SEG:){7,7}IPV6SEG|                # 1:2:3:4:5:6:7:8
           (IPV6SEG:){1,7}:|                      # 1::                                 1:2:3:4:5:6:7::
           (IPV6SEG:){1,6}:IPV6SEG|               # 1::8               1:2:3:4:5:6::8   1:2:3:4:5:6::8
           (IPV6SEG:){1,5}(:IPV6SEG){1,2}|        # 1::7:8             1:2:3:4:5::7:8   1:2:3:4:5::8
           (IPV6SEG:){1,4}(:IPV6SEG){1,3}|        # 1::6:7:8           1:2:3:4::6:7:8   1:2:3:4::8
           (IPV6SEG:){1,3}(:IPV6SEG){1,4}|        # 1::5:6:7:8         1:2:3::5:6:7:8   1:2:3::8
           (IPV6SEG:){1,2}(:IPV6SEG){1,5}|        # 1::4:5:6:7:8       1:2::4:5:6:7:8   1:2::8
           IPV6SEG:((:IPV6SEG){1,6})|             # 1::3:4:5:6:7:8     1::3:4:5:6:7:8   1::8
           :((:IPV6SEG){1,7}|:)|                  # ::2:3:4:5:6:7:8    ::2:3:4:5:6:7:8  ::8       ::       
           fe80:(:IPV6SEG){0,4}%[0-9a-zA-Z]{1,}|  # fe80::7:8%eth0     fe80::7:8%1  (link-local IPv6 addresses with zone index)
           ::(ffff(:0{1,4}){0,1}:){0,1}IPV4ADDR|  # ::255.255.255.255  ::ffff:255.255.255.255  ::ffff:0:255.255.255.255 (IPv4-mapped IPv6 addresses and IPv4-translated addresses)
           (IPV6SEG:){1,4}:IPV4ADDR               # 2001:db8:3:4::192.0.2.33  64:ff9b::192.0.2.33 (IPv4-Embedded IPv6 Address)
           )

Я опублікував сценарій на GitHub, який перевіряє регулярний вираз: https://gist.github.com/syzdek/6086792


3
У вас IPv4 регулярний вираз не відповідає таким IP- 127.000.000.001
адресам,

21
Сегменти IPv4 не повинні включати провідні нулі. Якщо присутній провідний нуль, сегмент IPv4 слід інтерпретувати в восьмерику. Отже, IPV4SEG, наведений вище, є правильним, оскільки не дозволяє "000". Однак він дозволяє "00", що не повинен.
пар

3
Не працював для мене в браузері, як я би очікував. Затверджено навіть reg.test ('3zzzzffe: 1900: 4545: 3: 200: f8ff: fe21: 67cf'), що, очевидно, не є дійсною IPv6 адресою. Тут було набагато кращі результати з регексом
Capaj

7
фантастичний ipv6 regex. знайшов невелику помилку із посиланням на локальний розділ. у вас було місце, fe80де це має бути щось на кшталт [fF][eE]80і ffffщо має бути щось на кшталт[fF]{4}
user2831628

4
+1 для показу, що регулярні вирази можуть бути (так само, як і будь-який вихідний код) фактично читабельні, якщо ви дотримуєтесь уваги та форматуєте їх.
Натікс

52

Далі буде підтверджено IPv4, IPv6 (повний та стислий) та IPv6v4 (повний та стислий) адреси:

'/^(?>(?>([a-f0-9]{1,4})(?>:(?1)){7}|(?!(?:.*[a-f0-9](?>:|$)){8,})((?1)(?>:(?1)){0,6})?::(?2)?)|(?>(?>(?1)(?>:(?1)){5}:|(?!(?:.*[a-f0-9]:){6,})(?3)?::(?>((?1)(?>:(?1)){0,4}):)?)?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?4)){3}))$/iD'

8
Незважаючи на те, що перевірку ip-s можна зробити, як пропонує Френк Крюгер, це рішення є таким, яке насправді відповідає на це питання (хоча я його ще не повністю перевірив), а також якщо у вас є багато IP-адрес, які ви хочете перевірити синтаксично і, можливо, відповідає рядку тексту, ви не можете використовувати техніку перевірки IP-адреси.
Гюрі

Привіт, я протестував цей RegExp і не працював на мене. На ньому написано, що D - недійсний прапор, і коли я його знімаю, він каже "SyntaxError: недійсний кількісний показник"
diosney

3
JavaScript реалізує підмножину регулярних виразів стилю Perl, а не всієї PCRE. Мій регекс не працюватиме без деяких розширених функцій PCRE.
MichaelRushton

2
Це дає виключення для мене в C #
sarat

1
Невдалий тестовий випадок: FE80: 0000: 0000: 0000: 0202: B3FF: FE1E: 8329 Використання останньої версії Elixir на цю дату, яка використовує PCRE під ним.
pmarreck

23

Здається, ви можете використовувати Python. Якщо так, ви можете використовувати щось подібне:

import socket

def check_ipv6(n):
    try:
        socket.inet_pton(socket.AF_INET6, n)
        return True
    except socket.error:
        return False

print check_ipv6('::1') # True
print check_ipv6('foo') # False
print check_ipv6(5)     # TypeError exception
print check_ipv6(None)  # TypeError exception

Я не думаю, що вам потрібно мати IPv6, зібраний в Python, щоб отримати inet_pton, який також може проаналізувати адреси IPv4, якщо ви вводите socket.AF_INETяк перший параметр. Примітка: це може не працювати в системах, що не є Unix.


4
Ви повинні вказати тип виключення в exceptпункті. В іншому випадку exceptвиберете все і може замаскувати непов'язані помилки. Тип тут повинен бути socket.error.
Айман Х'юрі

A) inet_pton не викидає інших винятків, якщо документи не помиляються, і B) навіть якби це сталося, що б ви ще повернули, окрім помилкових?
Джо Хільдебранд

2
Re: інші помилки ... якщо користувач передає не рядкові, TypeError з'їдається. Зрозуміло, що список не є ipv6, але я, мабуть, хотів би мати коропа, який я передавав неправильного типу.
Грегг Лінд

1
+1 Це мені дуже допомогло. Кілька додаткових пунктів, які слід додати: 1) socket.inet_pton може бути використаний для перевірки дійсності обох сімейств IP-адрес (IP та IPv6). 2) Документи тут ( docs.python.org/2/library/socket.html ) припускають, що це доступно на платформах Unix. Він може бути недоступний на Win-платформах.
mkoistinen

використання джанго, і це допомагає!
радісне срібло

23

З " регулярного вираження IPv6 ":

(\A([0-9a-f]{1,4}:){1,1}(:[0-9a-f]{1,4}){1,6}\Z)|
(\A([0-9a-f]{1,4}:){1,2}(:[0-9a-f]{1,4}){1,5}\Z)|
(\A([0-9a-f]{1,4}:){1,3}(:[0-9a-f]{1,4}){1,4}\Z)|
(\A([0-9a-f]{1,4}:){1,4}(:[0-9a-f]{1,4}){1,3}\Z)|
(\A([0-9a-f]{1,4}:){1,5}(:[0-9a-f]{1,4}){1,2}\Z)|
(\A([0-9a-f]{1,4}:){1,6}(:[0-9a-f]{1,4}){1,1}\Z)|
(\A(([0-9a-f]{1,4}:){1,7}|:):\Z)|
(\A:(:[0-9a-f]{1,4}){1,7}\Z)|
(\A((([0-9a-f]{1,4}:){6})(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3})\Z)|
(\A(([0-9a-f]{1,4}:){5}[0-9a-f]{1,4}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3})\Z)|
(\A([0-9a-f]{1,4}:){5}:[0-9a-f]{1,4}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)|
(\A([0-9a-f]{1,4}:){1,1}(:[0-9a-f]{1,4}){1,4}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)|
(\A([0-9a-f]{1,4}:){1,2}(:[0-9a-f]{1,4}){1,3}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)|
(\A([0-9a-f]{1,4}:){1,3}(:[0-9a-f]{1,4}){1,2}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)|
(\A([0-9a-f]{1,4}:){1,4}(:[0-9a-f]{1,4}){1,1}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)|
(\A(([0-9a-f]{1,4}:){1,5}|:):(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)|
(\A:(:[0-9a-f]{1,4}){1,5}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)

45
Регулярне вираження подібне до цього повинно бути "кодовим запахом", яке, можливо, регулярне вираження не є найкращим рішенням тут. (Хоча, мабуть, оп просив це ...)
Танатос

10
@ user712092 - всі, хто бачив кодову базу з такими очима
danielpops

2
Це абсолютно непотрібна перевага для РЕ. Програма, яка її генерувала, не розуміла, що вона робить. Людина ніколи не зробить це так. Не обманюйте очевидну складність - РЕ дійсно є "чорною магією" для багатьох людей, але немає причин розміщувати їх на іншій планеті!
Чак Колларс

+1, але в OMG має бути кращий спосіб зробити це: P Для довідки: для Rails це може допомогти: stackoverflow.com/questions/16965697/…
Tilo

1
Це справді кодовий запах; однак після огляду ви побачите, що кожен регулярний вираз є досить стислим. Проблема полягає в тому, що існують різні шаблони, створені 'стисненням' ipv6 - Кольори початку, середини та кінця, якщо ви скористалися подвійною двокрапкою, ви не можете використовувати її знову, понад загальну колони до і після подвійних повинні скластися. Perl 6, можливо, зможе вирішити це, але це далеко поза синтаксисом PCRE. (PS - я не рахую вбудований ipv4 наприкінці, який довший за розділ ipv6!)
Джерард ONeill

11

Мені довелося б настійно другий відповісти від Френка Крюгера .

Хоча ви говорите, що вам потрібен регулярний вираз, щоб відповідати IPv6-адресу, я припускаю, що вам дійсно потрібно, щоб мати можливість перевірити, чи вказана рядок є дійсною IPv6-адресою. Тут є тонка, але важлива відмінність.

Існує більше ніж один спосіб перевірити, чи дана рядок є дійсною IPv6 адресою, і регулярне узгодження виразів - лише одне рішення.

Використовуйте наявну бібліотеку, якщо можете. У бібліотеці буде менше помилок, і її використання призведе до менше коду для обслуговування.

Регулярний вираз, запропонований Factor Mystic , довгий і складний. Це, швидше за все, працює, але ви також повинні розглянути, як ви впораєтесь, якщо це несподівано не вдасться. Я намагаюся тут зробити те, що якщо ви не зможете самостійно сформувати необхідний регулярний вираз, ви не зможете легко налагодити його.

Якщо у вас немає підходящої бібліотеки, може бути краще написати процедуру перевірки IPv6, яка не залежить від регулярних виразів. Якщо ви пишете це, ви його розумієте, і якщо ви розумієте, ви можете додати коментарі, щоб пояснити це, щоб інші також могли зрозуміти і згодом підтримувати його.

Дійте обережно, використовуючи регулярний вираз, функціонал якого ви не можете пояснити іншому.


1
Використання двох регулярних виразів, ліберального виразу та виразу винятків для лову недійсних адрес, дозволених першим, може бути простішим, ніж один вираз ( return ex1.match(S) && ! ex2.match(S)).
Raedwald

4
Ви припускаєте, що він перевіряє окремі IP-адреси, коли майже напевно шукає IP-адреси у великому текстовому блоці.
Навін

8

Я не експерт Ipv6, але думаю, що ви можете отримати досить хороший результат легше за допомогою цього:

^([0-9A-Fa-f]{0,4}:){2,7}([0-9A-Fa-f]{1,4}$|((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)(\.|$)){4})$

відповісти "це дійсний ipv6", мені це виглядає нормально. Щоб розбити його по частинах ... забудьте. Я не вказав не вказаного (: :), оскільки в моїй базі даних немає не вказаної адреси.

початок: ^([0-9A-Fa-f]{0,4}:){2,7}<- відповідність стисливій частині, ми можемо перекласти це як: між 2 та 7 двокрапкою, які можуть мати дванадцяте число між ними.

далі: [0-9A-Fa-f]{1,4}$<- шістнадцяткове число (ведуче 0 пропущено) АБО ((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)(\.|$)){4}<- адреса Ipv4


1
+1 за те, що насправді дотримується питання щодо ОП та представляє відносно гарний вираз, який дещо працює.
xebeche

1
Це не відповідає ":: 1"
lsalamon

Так? У синтаксесі java regex він відповідає:start() = 0, end() = 3 group(0) = "::1" group(1) = ":" group(2) = "1" group(3) = "null" group(4) = "null" group(5) = "null"
Ремі Морін

Десь десь хтось сповістить мене про проблему з моїм регулярним виразом, стисла частина "::" може з’явитися лише один раз. Тож ":: 1 :: 2" відповідатиме моєму регулярному вираженню, але це не дійсний IPV6. Другий регулярний вираз може підтвердити цей випадок. Повна рекомендація полягала в тому, щоб використовувати державний аналізатор для перевірки. Я погоджуюся, що отриманий код буде легше читати та підтримувати (а хтось, мабуть, вже десь закодував його у відкритому коді).
Ремі Морін

8

Це також фіксує зворотний зв'язок (:: 1) та ipv6 адреси. змінив {} на + і поставив: усередині першого квадратного дужка.

([a-f0-9:]+:+)+[a-f0-9]+

перевірено на ifconfig -a вихід http://regexr.com/

Опція Unix або Mac OSx термінал o повертає лише відповідні результати (ipv6), включаючи :: 1

ifconfig -a | egrep -o '([a-f0-9:]+:+)+[a-f0-9]+'

Отримайте всі IP-адреси (IPv4 АБО IPv6) та друкуйте відповідність на unix OSx терміні

ifconfig -a | egrep -o '([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}) | (([a-f0-9:]+:+)+[a-f0-9]+)'

Мені подобається простота. Це врешті спрацювало для мене:ip a | grep -Po '[\w:]+:+[\w:]+'
Ноам Манос

Гумор цінується!
Soumya Kanti

Коли я запускаю ipconfig / all, моя ip-адреса закінчується на% 10, цей вираз не відповідає цій частині?
Петро

7

Цей регулярний вираз буде відповідати дійсним IPv6 та IPv4 адресам відповідно до GNU C ++ реалізації регулярного вираження в режимі РЕГУЛЯРНОГО РОЗШИРЕНОГО:

"^\s*((([0-9A-Fa-f]{1,4}:){7}([0-9A-Fa-f]{1,4}|:))|(([0-9A-Fa-f]{1,4}:){6}(:[0-9A-Fa-f]{1,4}|((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3})|:))|(([0-9A-Fa-f]{1,4}:){5}(((:[0-9A-Fa-f]{1,4}){1,2})|:((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3})|:))|(([0-9A-Fa-f]{1,4}:){4}(((:[0-9A-Fa-f]{1,4}){1,3})|((:[0-9A-Fa-f]{1,4})?:((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3}))|:))|(([0-9A-Fa-f]{1,4}:){3}(((:[0-9A-Fa-f]{1,4}){1,4})|((:[0-9A-Fa-f]{1,4}){0,2}:((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3}))|:))|(([0-9A-Fa-f]{1,4}:){2}(((:[0-9A-Fa-f]{1,4}){1,5})|((:[0-9A-Fa-f]{1,4}){0,3}:((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3}))|:))|(([0-9A-Fa-f]{1,4}:){1}(((:[0-9A-Fa-f]{1,4}){1,6})|((:[0-9A-Fa-f]{1,4}){0,4}:((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3}))|:))|(:(((:[0-9A-Fa-f]{1,4}){1,7})|((:[0-9A-Fa-f]{1,4}){0,5}:((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3}))|:)))(%.+)?\s*$"

5

Остерігайся! У Java використання InetAddress та пов'язаних з ними класів (Inet4Address, Inet6Address, URL) може спричинити мережевий трафік! Наприклад, розв’язання DNS (URL.equals, InetAddress з рядка!) Цей дзвінок може зайняти багато часу і блокується!

Для IPv6 у мене є щось подібне. Це, звичайно, не обробляє дуже тонкі деталі IPv6, так як індекси зони дозволяються лише для деяких класів IPv6-адрес. І цей регулярний вираз не написаний для групового захоплення, це лише «відповідники».

S - сегмент IPv6 = [0-9a-f]{1,4}

I - IPv4 = (?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9]{1,2})\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9]{1,2})

Схематично (перша частина відповідає IPv6-адресам із суфіксом IPv4, друга частина відповідає IPv6-адресам, остання зазначає індекс зони):

(
(
::(S:){0,5}|
S::(S:){0,4}|
(S:){2}:(S:){0,3}|
(S:){3}:(S:){0,2}|
(S:){4}:(S:)?|
(S:){5}:|
(S:){6}
)
I

|

:(:|(:S){1,7})|
S:(:|(:S){1,6})|
(S:){2}(:|(:S){1,5})|
(S:){3}(:|(:S){1,4})|
(S:){4}(:|(:S){1,3})|
(S:){5}(:|(:S){1,2})|
(S:){6}(:|(:S))|
(S:){7}:|
(S:){7}S
)

(?:%[0-9a-z]+)?

І ось тут може бути регулярна виразка (нечутливий до регістру, оточує те, що коли-небудь потрібно, як початок / кінець рядка тощо):

(?:
(?:
::(?:[0-9a-f]{1,4}:){0,5}|
[0-9a-f]{1,4}::(?:[0-9a-f]{1,4}:){0,4}|
(?:[0-9a-f]{1,4}:){2}:(?:[0-9a-f]{1,4}:){0,3}|
(?:[0-9a-f]{1,4}:){3}:(?:[0-9a-f]{1,4}:){0,2}|
(?:[0-9a-f]{1,4}:){4}:(?:[0-9a-f]{1,4}:)?|
(?:[0-9a-f]{1,4}:){5}:|
(?:[0-9a-f]{1,4}:){6}
)
(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9]{1,2})\.){3}
(?:25[0-5]|2[0-4][0-9]|[01]?[0-9]{1,2})|

:(?::|(?::[0-9a-f]{1,4}){1,7})|
[0-9a-f]{1,4}:(?::|(?::[0-9a-f]{1,4}){1,6})|
(?:[0-9a-f]{1,4}:){2}(?::|(?::[0-9a-f]{1,4}){1,5})|
(?:[0-9a-f]{1,4}:){3}(?::|(?::[0-9a-f]{1,4}){1,4})|
(?:[0-9a-f]{1,4}:){4}(?::|(?::[0-9a-f]{1,4}){1,3})|
(?:[0-9a-f]{1,4}:){5}(?::|(?::[0-9a-f]{1,4}){1,2})|
(?:[0-9a-f]{1,4}:){6}(?::|(?::[0-9a-f]{1,4}))|
(?:[0-9a-f]{1,4}:){7}:|
(?:[0-9a-f]{1,4}:){7}[0-9a-f]{1,4}
)

(?:%[0-9a-z]+)?

4

Наступний регулярний вираз призначений лише для IPv6. Групи 1 збігаються з ІС.

(([0-9a-fA-F]{0,4}:){1,7}[0-9a-fA-F]{0,4})

+1 Не завжди потрібно мати ідеальний надскладний вираз, який людина не може зрозуміти. Я буду використовувати цей, тому що я розумію, що це робить, і в моєму випадку я можу бути впевнений, що якщо я отримав щось, що нагадує дійсний ipv6, значить, це дійсний ipv6.
Девід Л.

3
це не відповідатиме: fe80 :: 1 або 2342: 32fd :: 2d32
James

3

Простий регулярний вираз, який відповідає, але я не рекомендував би для будь-якої перевірки це:

([A-Fa-f0-9]{1,4}::?){1,7}[A-Fa-f0-9]{1,4}

Зверніть увагу, що це відповідає стисненню в будь-якій точці адреси, хоча воно не збігається з адресою петлі :: 1. Я вважаю це розумним компромісом для того, щоб просто зробити регулярний вираз.

Я успішно використовую це в правилах розумного вибору iTerm2 для чотирьох клацання IPv6-адрес.


3
Ти мав на увазі A-F, ні A-Z! Також зауважте, що ви виключаєте позначення крапки з пунктиром.
xebeche

3

Якщо ви використовуєте Perl, спробуйте Net :: IPv6Addr

use Net::IPv6Addr;

if( defined Net::IPv6Addr::is_ipv6($ip_address) ){
  print "Looks like an ipv6 address\n";
}

NetAddr :: IP

use NetAddr::IP;

my $obj = NetAddr::IP->new6($ip_address);

Перевірка :: IP

use Validate::IP qw'is_ipv6';

if( is_ipv6($ip_address) ){
  print "Looks like an ipv6 address\n";
}

Або Дані :: Підтвердити :: IP search.cpan.org/~neely/Data-Validate-IP-0.11/lib/Data/Validate/… .
Калімо

2

У Скалі використовують відомі валідатори Apache Commons.

http://mvnrepository.com/artifact/commons-validator/commons-validator/1.4.1

libraryDependencies += "commons-validator" % "commons-validator" % "1.4.1"


import org.apache.commons.validator.routines._

/**
 * Validates if the passed ip is a valid IPv4 or IPv6 address.
 *
 * @param ip The IP address to validate.
 * @return True if the passed IP address is valid, false otherwise.
 */  
 def ip(ip: String) = InetAddressValidator.getInstance().isValid(ip)

Після тестування методу ip(ip: String):

"The `ip` validator" should {
  "return false if the IPv4 is invalid" in {
    ip("123") must beFalse
    ip("255.255.255.256") must beFalse
    ip("127.1") must beFalse
    ip("30.168.1.255.1") must beFalse
    ip("-1.2.3.4") must beFalse
  }

  "return true if the IPv4 is valid" in {
    ip("255.255.255.255") must beTrue
    ip("127.0.0.1") must beTrue
    ip("0.0.0.0") must beTrue
  }

  //IPv6
  //@see: http://www.ronnutter.com/ipv6-cheatsheet-on-identifying-valid-ipv6-addresses/
  "return false if the IPv6 is invalid" in {
    ip("1200::AB00:1234::2552:7777:1313") must beFalse
  }

  "return true if the IPv6 is valid" in {
    ip("1200:0000:AB00:1234:0000:2552:7777:1313") must beTrue
    ip("21DA:D3:0:2F3B:2AA:FF:FE28:9C5A") must beTrue
  }
}

Цікаво, що він стверджує, що це дійсна адреса, " перевіряє, чи переданий ip є дійсною IPv4 або IPv6 адресою. ", Але він дійсно лише перевіряє, чи він відформатований як дійсна адреса. Наприклад, 1200:0000:AB00:1234:0000:2552:7777:1313це допустимий формат для адреси IPv6, але це не є дійсною IPv6 адресою, оскільки тестовий метод повертається. Б'юсь об заклад, він вважає 241.54.113.65, що це дійсна IPv4-адреса.
Рон Мопін

2

Дивлячись на закономірності, що містяться в інших відповідях, існує ряд хороших моделей, які можна вдосконалити, посилаючись на групи та використовуючи головокруги. Ось приклад шаблону, який самостійно посилається на те, що я використовував би в PHP, якби мені довелося:

^(?<hgroup>(?<hex>[[:xdigit:]]{0,4}) # grab a sequence of up to 4 hex digits
                                     # and name this pattern for usage later
     (?<!:::):{1,2})                 # match 1 or 2 ':' characters
                                     # as long as we can't match 3
 (?&hgroup){1,6} # match our hex group 1 to 6 more times
 (?:(?:
    # match an ipv4 address or
    (?<dgroup>2[0-5]|(?:2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3}(?&dgroup)
    # match our hex group one last time
    |(?&hex))$

Примітка: PHP має вбудований фільтр для цього, що було б кращим рішенням, ніж цей шаблон.

Аналіз Regex101


2

Я створив наступне за допомогою python і працює з модулем re. Затвердження, що дивляться наперед, гарантують, що в адресі з’явиться правильна кількість крапок чи товстих кольорів. Він не підтримує IPv4 в нотації IPv6.

pattern = '^(?=\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$)(?:(?:25[0-5]|[12][0-4][0-9]|1[5-9][0-9]|[1-9]?[0-9])\.?){4}$|(?=^(?:[0-9a-f]{0,4}:){2,7}[0-9a-f]{0,4}$)(?![^:]*::.+::[^:]*$)(?:(?=.*::.*)|(?=\w+:\w+:\w+:\w+:\w+:\w+:\w+:\w+))(?:(?:^|:)(?:[0-9a-f]{4}|[1-9a-f][0-9a-f]{0,3})){0,8}(?:::(?:[0-9a-f]{1,4}(?:$|:)){0,6})?$'
result = re.match(pattern, ip)
if result: result.group(0)

2

Regexes для ipv6 може стати справді складним, якщо розглядати адреси із вбудованим ipv4 та стислими адресами, як видно з деяких із цих відповідей.

Бібліотека Java з відкритим кодом IPAddress перевірятиме всі стандартні подання IPv6 та IPv4, а також підтримує префікс-довжину (та перевірку таких). Відмова: Я керівник проекту цієї бібліотеки.

Приклад коду:

        try {
            IPAddressString str = new IPAddressString("::1");
            IPAddress addr = str.toAddress();
            if(addr.isIPv6() || addr.isIPv6Convertible()) {
                IPv6Address ipv6Addr = addr.toIPv6();
            }
            //use address
        } catch(AddressStringException e) {
            //e.getMessage has validation error
        }


1

Важко знайти регулярний вираз, який працює для всіх випадків IPv6. Зазвичай вони важкі в обслуговуванні, не легко читаються і можуть спричинити проблеми з роботою. Отже, я хочу поділитися альтернативним рішенням, яке я розробив: Regular Expression (RegEx) для IPv6, окремо від IPv4

Тепер ви можете запитати, що "Цей метод знаходить лише IPv6, як я можу знайти IPv6 у тексті чи файлі?" Ось методи і для цього питання.

Примітка : Якщо ви не хочете використовувати клас IPAddress у .NET, ви також можете замінити його моїм методом . Він також охоплює відображений IPv4 та особливі випадки, тоді як IPAddress не охоплює.

class IPv6
{
    public List<string> FindIPv6InFile(string filePath)
    {
        Char ch;
        StringBuilder sbIPv6 = new StringBuilder();
        List<string> listIPv6 = new List<string>();
        StreamReader reader = new StreamReader(filePath);
        do
        {
            bool hasColon = false;
            int length = 0;

            do
            {
                ch = (char)reader.Read();

                if (IsEscapeChar(ch))
                    break;

                //Check the first 5 chars, if it has colon, then continue appending to stringbuilder
                if (!hasColon && length < 5)
                {
                    if (ch == ':')
                    {
                        hasColon = true;
                    }
                    sbIPv6.Append(ch.ToString());
                }
                else if (hasColon) //if no colon in first 5 chars, then dont append to stringbuilder
                {
                    sbIPv6.Append(ch.ToString());
                }

                length++;

            } while (!reader.EndOfStream);

            if (hasColon && !listIPv6.Contains(sbIPv6.ToString()) && IsIPv6(sbIPv6.ToString()))
            {
                listIPv6.Add(sbIPv6.ToString());
            }

            sbIPv6.Clear();

        } while (!reader.EndOfStream);
        reader.Close();
        reader.Dispose();

        return listIPv6;
    }

    public List<string> FindIPv6InText(string text)
    {
        StringBuilder sbIPv6 = new StringBuilder();
        List<string> listIPv6 = new List<string>();

        for (int i = 0; i < text.Length; i++)
        {
            bool hasColon = false;
            int length = 0;

            do
            {
                if (IsEscapeChar(text[length + i]))
                    break;

                //Check the first 5 chars, if it has colon, then continue appending to stringbuilder
                if (!hasColon && length < 5)
                {
                    if (text[length + i] == ':')
                    {
                        hasColon = true;
                    }
                    sbIPv6.Append(text[length + i].ToString());
                }
                else if (hasColon) //if no colon in first 5 chars, then dont append to stringbuilder
                {
                    sbIPv6.Append(text[length + i].ToString());
                }

                length++;

            } while (i + length != text.Length);

            if (hasColon && !listIPv6.Contains(sbIPv6.ToString()) && IsIPv6(sbIPv6.ToString()))
            {
                listIPv6.Add(sbIPv6.ToString());
            }

            i += length;
            sbIPv6.Clear();
        }

        return listIPv6;
    }

    bool IsEscapeChar(char ch)
    {
        if (ch != ' ' && ch != '\r' && ch != '\n' && ch!='\t')
        {
            return false;
        }

        return true;
    }

    bool IsIPv6(string maybeIPv6)
    {
        IPAddress ip;
        if (IPAddress.TryParse(maybeIPv6, out ip))
        {
            return ip.AddressFamily == AddressFamily.InterNetworkV6;
        }
        else
        {
            return false;
        }
    }

}

1

InetAddressUtilsмає всі шаблони. Я в кінцевому підсумку використовував їх шаблон безпосередньо і вставлю його тут для довідки:

private static final String IPV4_BASIC_PATTERN_STRING =
        "(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\\.){3}" + // initial 3 fields, 0-255 followed by .
         "([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])"; // final field, 0-255

private static final Pattern IPV4_PATTERN =
    Pattern.compile("^" + IPV4_BASIC_PATTERN_STRING + "$");

private static final Pattern IPV4_MAPPED_IPV6_PATTERN = // TODO does not allow for redundant leading zeros
        Pattern.compile("^::[fF]{4}:" + IPV4_BASIC_PATTERN_STRING + "$");

private static final Pattern IPV6_STD_PATTERN =
    Pattern.compile(
            "^[0-9a-fA-F]{1,4}(:[0-9a-fA-F]{1,4}){7}$");

private static final Pattern IPV6_HEX_COMPRESSED_PATTERN =
    Pattern.compile(
            "^(([0-9A-Fa-f]{1,4}(:[0-9A-Fa-f]{1,4}){0,5})?)" + // 0-6 hex fields
             "::" +
             "(([0-9A-Fa-f]{1,4}(:[0-9A-Fa-f]{1,4}){0,5})?)$"); // 0-6 hex fields 

1

Використовуючи Ruby? Спробуйте це:

/^(((?=.*(::))(?!.*\3.+\3))\3?|[\dA-F]{1,4}:)([\dA-F]{1,4}(\3|:\b)|\2){5}(([\dA-F]{1,4}(\3|:\b|$)|\2){2}|(((2[0-4]|1\d|[1-9])?\d|25[0-5])\.?\b){4})\z/i

1

Залежно від ваших потреб, наближення:

[0-9a-f:]+

може бути достатньо (як, наприклад, при простому зібранні файлів журналу, наприклад.)


0

Для користувачів PHP 5.2+ filter_varчудово працює.

Я знаю, що це не дає відповіді на початкове запитання (конкретно, на регулярне рішення), але я публікую це, сподіваючись, що це може допомогти комусь іншому в майбутньому.

$is_ip4address = (filter_var($ip, FILTER_VALIDATE_IP, FILTER_FLAG_IPV4) !== FALSE);
$is_ip6address = (filter_var($ip, FILTER_VALIDATE_IP, FILTER_FLAG_IPV6) !== FALSE);

0

Це буде працювати для IPv4 та IPv6:

^(([0-9a-f]{0,4}:){1,7}[0-9a-f]{1,4}|([0-9]{1,3}\.){3}[0-9]{1,3})$

2
Він відповідає невірним адресам з 2 примірниками ::. наприклад2404:6800::4003:c02::8a
nhahtdh

відповідає недійсним IPv4 666.666.666.666
Райан Вільямс

0

Ось що я придумав, використавши трохи пошуку та названих груп. Звичайно, це лише IPv6, але він не повинен перешкоджати додатковим шаблонам, якщо ви хочете додати IPv4:

(?=([0-9a-f]+(:[0-9a-f])*)?(?P<wild>::)(?!([0-9a-f]+:)*:))(::)?([0-9a-f]{1,4}:{1,2}){0,6}(?(wild)[0-9a-f]{0,4}|[0-9a-f]{1,4}:[0-9a-f]{1,4})


0

Цілком відповідні місцеві з походження з квадратними дужками. Я знаю, що це не так всеохоплююче, але у javascript іншим було складно відстежувати проблеми, перш за все, ті, що не працюють, тому, здається, це отримує мені те, що мені потрібно зараз. додаткові столиці АФ також не потрібні.

^\[([0-9a-fA-F]{1,4})(\:{1,2})([0-9a-fA-F]{1,4})(\:{1,2})([0-9a-fA-F]{1,4})(\:{1,2})([0-9a-fA-F]{1,4})(\:{1,2})([0-9a-fA-F]{1,4})\]

Версія Джинко спрощена, і я краще бачу.


0

Як було сказано вище, ще одним способом отримання текстового представлення протоколу IPv6, що підтверджує аналіз, є використання програмування. Ось один, який повністю відповідає RFC-4291 та RFC-5952. Я написав цей код в ANSI C (працює з GCC, пройшов тести на Linux - працює з кланг, пройшов тести на FreeBSD). Таким чином, він покладається лише на стандартну бібліотеку ANSI C, тому його можна компілювати скрізь (я використовував її для розбору IPv6 всередині модуля ядра з FreeBSD).

// IPv6 textual representation validating parser fully compliant with RFC-4291 and RFC-5952
// BSD-licensed / Copyright 2015-2017 Alexandre Fenyo

#include <string.h>
#include <netinet/in.h>
#include <stdlib.h>
#include <stdio.h>
#include <ctype.h>

typedef enum { false, true } bool;

static const char hexdigits[] = "0123456789abcdef";
static int digit2int(const char digit) {
  return strchr(hexdigits, digit) - hexdigits;
}

// This IPv6 address parser handles any valid textual representation according to RFC-4291 and RFC-5952.
// Other representations will return -1.
//
// note that str input parameter has been modified when the function call returns
//
// parse_ipv6(char *str, struct in6_addr *retaddr)
// parse textual representation of IPv6 addresses
// str:     input arg
// retaddr: output arg
int parse_ipv6(char *str, struct in6_addr *retaddr) {
  bool compressed_field_found = false;
  unsigned char *_retaddr = (unsigned char *) retaddr;
  char *_str = str;
  char *delim;

  bzero((void *) retaddr, sizeof(struct in6_addr));
  if (!strlen(str) || strchr(str, ':') == NULL || (str[0] == ':' && str[1] != ':') ||
      (strlen(str) >= 2 && str[strlen(str) - 1] == ':' && str[strlen(str) - 2] != ':')) return -1;

  // convert transitional to standard textual representation
  if (strchr(str, '.')) {
    int ipv4bytes[4];
    char *curp = strrchr(str, ':');
    if (curp == NULL) return -1;
    char *_curp = ++curp;
    int i;
    for (i = 0; i < 4; i++) {
      char *nextsep = strchr(_curp, '.');
      if (_curp[0] == '0' || (i < 3 && nextsep == NULL) || (i == 3 && nextsep != NULL)) return -1;
      if (nextsep != NULL) *nextsep = 0;
      int j;
      for (j = 0; j < strlen(_curp); j++) if (_curp[j] < '0' || _curp[j] > '9') return -1;
      if (strlen(_curp) > 3) return -1;
      const long val = strtol(_curp, NULL, 10);
      if (val < 0 || val > 255) return -1;
      ipv4bytes[i] = val;
      _curp = nextsep + 1;
    }
    sprintf(curp, "%x%02x:%x%02x", ipv4bytes[0], ipv4bytes[1], ipv4bytes[2], ipv4bytes[3]);
  }

  // parse standard textual representation
  do {
    if ((delim = strchr(_str, ':')) == _str || (delim == NULL && !strlen(_str))) {
      if (delim == str) _str++;
      else if (delim == NULL) return 0;
      else {
        if (compressed_field_found == true) return -1;
        if (delim == str + strlen(str) - 1 && _retaddr != (unsigned char *) (retaddr + 1)) return 0;
        compressed_field_found = true;
        _str++;
        int cnt = 0;
        char *__str;
        for (__str = _str; *__str; ) if (*(__str++) == ':') cnt++;
        unsigned char *__retaddr = - 2 * ++cnt + (unsigned char *) (retaddr + 1);
        if (__retaddr <= _retaddr) return -1;
        _retaddr = __retaddr;
      }
    } else {
      char hexnum[4] = "0000";
      if (delim == NULL) delim = str + strlen(str);
      if (delim - _str > 4) return -1;
      int i;
      for (i = 0; i < delim - _str; i++)
        if (!isxdigit(_str[i])) return -1;
        else hexnum[4 - (delim - _str) + i] = tolower(_str[i]);
      _str = delim + 1;
      *(_retaddr++) = (digit2int(hexnum[0]) << 4) + digit2int(hexnum[1]);
      *(_retaddr++) = (digit2int(hexnum[2]) << 4) + digit2int(hexnum[3]);
    }
  } while (_str < str + strlen(str));
  return 0;
}

-1

Спробуйте цей невеликий одноводковий. Він повинен відповідати лише дійсним стислим / стислим IPv6 адресам (без гібридів IPv4)

/(?!.*::.*::)(?!.*:::.*)(?!:[a-f0-9])((([a-f0-9]{1,4})?[:](?!:)){7}|(?=(.*:[:a-f0-9]{1,4}::|^([:a-f0-9]{1,4})?::))(([a-f0-9]{1,4})?[:]{1,2}){1,6})[a-f0-9]{1,4}/

Насправді, дійсні адреси IPv6 включають нестиснений, стислий, нестиснений гібрид та стислий гібрид. Це дійсно займає набагато більше, ніж ви насправді повинні відповідати будь-якому дійсному текстовому поданню адреси IPv6.
Рон Мопін

-2

Регекс дозволяє використовувати провідні нулі в частинах IPv4.

Деякі дистрибутивні програми Unix та Mac перетворюють ці сегменти у вісімки.

Я пропоную використовувати 25[0-5]|2[0-4]\d|1\d\d|[1-9]?\dяк сегмент IPv4.


-2

Якщо ви хочете лише нормальних IP-адрес (без косої риски), тут:

^(?:[0-9a-f]{1,4}(?:::)?){0,7}::[0-9a-f]+$

Я використовую його для виділення синтаксису в додатку редактора файлів хостів. Працює як шарм.


Ні в якому разі це ніколи не працює пристойно, він не може співставити одну адресу ipv6 з єдиною двокрапкою в ній, всі ваші відповідність є подвійними двокрапками, і ви явно потребуєте подвійної двокрапки для останньої групи, підсумовування може відбутися де завгодно. .
KillianDS

(?: [0-9a-f] {1,4} (? :::?)?) {0,7} ::? [0-9a-f] {1,4}
Гаррі

І все-таки неправильно, але навіть тоді ви в кінцевому підсумку повторите відповідь JinnKo, що досить добре для простих цілей, але все ж має недоліки (не вловлює подвійне узагальнення і не дозволяє пунктирними квадратиками, ні localhost, ні :: завершенням,. ..)
KillianDS
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.