В Linux у мене каталог з великою кількістю файлів. Деякі з них мають символи, що не належать до ASCII, але всі вони є дійсними UTF-8 . Одна програма має помилку, яка заважає їй працювати з іменами, що не належать до ASCII, і я маю з’ясувати, на скільки це впливає. Я збирався зробити це за допомогою, find
а потім зробити греп, щоб надрукувати символи, що не належать до ASCII, а потім зробити а, wc -l
щоб знайти номер. Це не повинно бути грепом; Я можу використовувати будь-який стандартний регулярний вираз Unix , наприклад Perl , sed , AWK тощо.
Однак, чи є регулярний вираз "будь-який символ, який не є символом ASCII"?
/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F-\x9F]