Я спробував це використати, але не вийшло -
return value.replaceAll("/[^A-Za-z0-9 ]/", "");
Я спробував це використати, але не вийшло -
return value.replaceAll("/[^A-Za-z0-9 ]/", "");
Відповіді:
Використовуйте [^A-Za-z0-9]
.
Примітка: видалено пробіл, оскільки це, як правило, не вважається буквено-цифровим.
Спробуйте
return value.replaceAll("[^A-Za-z0-9]", "");
або
return value.replaceAll("[\\W]|_", "");
return value.replaceAll("\\W", "");
Ви повинні знати, що [^a-zA-Z]
замінять символи, які не знаходяться в діапазоні символів AZ / az. Це означає, що спеціальні символи, наприклад é
, ß
тощо, або кириличні символи, і такі будуть видалені.
Якщо заміна цих символів не потрібна, використовуйте наперед задані класи символів:
str.replaceAll("[^\\p{IsAlphabetic}\\p{IsDigit}]", "");
PS: \p{Alnum}
не досягає цього ефекту, він діє так само, як [A-Za-z0-9]
.
[^\\p{IsAlphabetic}\\p{IsDigit}]
працює добре.
{IsDigit}
для мене не працює і {Digit}
полягає в тому, що я намагаюся це зробити на Android. А Android UNICODE_CHARACTER_CLASS
увімкнено за замовчуванням. Дякуємо за допуск.
Ви також можете спробувати цей простіший регулярний вираз:
str = str.replaceAll("\\P{Alnum}", "");
str.replaceAll("[^\\p{Alnum}\\s]", "")
\\p{Alnum}\\p{Space}
.
Я створив цей метод створення імен файлів:
public static String safeChar(String input)
{
char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
char[] charArray = input.toString().toCharArray();
StringBuilder result = new StringBuilder();
for (char c : charArray)
{
for (char a : allowed)
{
if(c==a) result.append(a);
}
}
return result.toString();
}
value.replaceAll("[^A-Za-z0-9]", "")
[^abc]
Коли каре^
з'являється як перший символ у квадратних дужках, це заперечує візерунок. Цей візерунок відповідає будь-якому символу, крім a або b або c.
Дивлячись на ключове слово як на дві функції:
[(Pattern)] = match(Pattern)
[^(Pattern)] = notMatch(Pattern)
Більше того, щодо візерунка:
A-Z = all characters included from A to Z
a-z = all characters included from a to z
0=9 = all characters included from 0 to 9
Тому він замінить усі символи, які НЕ включені в шаблон
Якщо ви також хочете дозволити буквено-цифрові символи, які не належать до набору символів ascii, як, наприклад, німецький umlaut's, ви можете розглянути наступне рішення:
String value = "your value";
// this could be placed as a static final constant, so the compiling is only done once
Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);
value = pattern.matcher(value).replaceAll("");
Зверніть увагу, що за використання прапора UNICODE_CHARACTER_CLASS може бути застосовано покарання за виконання (див. Javadoc цього прапора)
Простий метод:
public boolean isBlank(String value) {
return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}
public String normalizeOnlyLettersNumbers(String str) {
if (!isBlank(str)) {
return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
} else {
return "";
}
}
public static void main(String[] args) {
String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";
System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));
}
вихід: ChlamydiasppIgGIgMIgAAbs8006
Github: https://github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java
CharMatcher від Guava пропонує стисле рішення:
output = CharMatcher.javaLetterOrDigit().retainFrom(input);