Чесно кажучи, регулярні вирази - не найкраща ідея для цього типу розбору. Опублікований вами регулярний вираз, ймовірно, буде чудово працювати для простих випадків, але якщо справа стає більш складною, у вас будуть величезні проблеми (та сама причина, чому ви не можете надійно аналізувати HTML із регулярними виразами). Я знаю, що ви, мабуть, не хочете цього чути, я знаю, що ні, коли я задавав однотипні запитання, але синтаксичний аналіз рядків став для мене НАДІЙ надійнішим після того, як я перестав намагатися використовувати регулярні вирази для всього.
jTopas - це ДИВОВИЙ токенізатор , завдяки якому досить легко писати синтаксичні аналізатори вручну (Я НАСОЛО пропоную jtopas у порівнянні зі стандартними бібліотеками сканера Java та ін.). Якщо ви хочете побачити jtopas в дії, ось кілька синтаксичних аналізаторів, які я написав за допомогою jTopas для синтаксичного аналізу файлів цього типу
Якщо ви розбираєте файли XML, вам слід використовувати бібліотеку синтаксичного аналізатора xml. Не робіть це самостійно, якщо тільки ви не робите це заради задоволення, там є безліч перевірених варіантів
[]квадратних дужок, які є метасимволами у регулярному виразі.