Запитання з тегом «character-properties»

11
Регекси JavaScript + Unicode
Як я можу використовувати регулярні вирази Unicode в JavaScript? Наприклад, має бути щось подібне до того, \wщо може відповідати будь-якій точці коду в категорії Letters or Marks (не лише ASCII), і, сподіваємось, мати фільтри типу [[P *]] для пунктуації тощо.

3
Unicode еквіваленти для \ w і \ b в регулярних виразах Java?
Багато сучасних реагеджезних інтерпретацій інтерпретують \wстенографію класу символів як "будь-яку букву, цифру або з'єднувальний розділовий знак" (зазвичай: підкреслення). Таким чином, регулярний вираз , як \w+сірники слова , як hello, élève, GOÄ_432або gefräßig. На жаль, Java ні. У Java \wобмежується [A-Za-z0-9_]. Це ускладнює узгодження слів, подібних до вищезгаданих, серед інших проблем. …

2
Python і регулярний вираз з Unicode
Мені потрібно видалити деякі символи Unicode із рядка 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ' Я знаю, що вони тут існують точно. Я намагався: re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ') але це не працює. Рядок залишається незмінним. Що я роблю не так?
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.