Відповіді:
>>> import re
>>> re.sub("[^0-9]", "", "sdkjh987978asd098as0980a98sd")
'987978098098098'
Не впевнений, чи це найбільш ефективний спосіб, але:
>>> ''.join(c for c in "abc123def456" if c.isdigit())
'123456'
В ''.join
означає частину , щоб об'єднати всі отримані символи разом без будь - яких символів між ними. Тоді решта - це розуміння списку, де (як ви, напевно, здогадуєтесь) ми беремо лише ті частини рядка, які відповідають умові isdigit
.
Це має працювати як для об'єктів, так і для об'єктів unicode в Python2, а також для обох рядків і байтів у Python3:
# python <3.0
def only_numerics(seq):
return filter(type(seq).isdigit, seq)
# python ≥3.0
def only_numerics(seq):
seq_type= type(seq)
return seq_type().join(filter(seq_type.isdigit, seq))
Просто для додання ще однієї опції до суміші є кілька корисних констант всередині string
модуля. Хоча більш корисні в інших випадках, їх можна використовувати тут.
>>> from string import digits
>>> ''.join(c for c in "abc123def456" if c in digits)
'123456'
У модулі є кілька констант, серед яких:
ascii_letters
(abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ)hexdigits
(0123456789abcdefABCDEF)Якщо ви активно використовуєте ці константи, можливо, варто їх приховати до а frozenset
. Це дозволяє шукати O (1), а не O (n), де n - довжина постійної для початкових рядків.
>>> digits = frozenset(digits)
>>> ''.join(c for c in "abc123def456" if c in digits)
'123456'
Найшвидший підхід, якщо вам потрібно виконати більше ніж одну-дві такі операції з видалення (або навіть лише одну, але на дуже довгій рядку! -), покладатися на translate
метод рядків, навіть якщо для цього потрібна певна підготовка:
>>> import string
>>> allchars = ''.join(chr(i) for i in xrange(256))
>>> identity = string.maketrans('', '')
>>> nondigits = allchars.translate(identity, string.digits)
>>> s = 'abc123def456'
>>> s.translate(identity, nondigits)
'123456'
translate
Метод відрізняється, і , можливо , трохи простіше , простіше у використанні, на рядках Unicode , ніж на байтових рядків, до речі:
>>> unondig = dict.fromkeys(xrange(65536))
>>> for x in string.digits: del unondig[ord(x)]
...
>>> s = u'abc123def456'
>>> s.translate(unondig)
u'123456'
Ви можете скористатися класом відображення, а не фактичним диктом, особливо якщо рядок Unicode потенційно може містити символи з дуже високими значеннями порядків (це зробить дикт надмірно великим ;-). Наприклад:
>>> class keeponly(object):
... def __init__(self, keep):
... self.keep = set(ord(c) for c in keep)
... def __getitem__(self, key):
... if key in self.keep:
... return key
... return None
...
>>> s.translate(keeponly(string.digits))
u'123456'
>>>
(sys.maxunicode - number_of_non_numeric_chars)
записи. (3) Поміркуйте, чи може string.digits не бути достатнім, що призводить до необхідності зламати модуль unicodedata (4), розгляньте re.sub (r '(? U) \ D +', u '', text) для простоти та потенціалу швидкість.
Безліч правильних відповідей, але у випадку, якщо ви хочете, щоб це поплавком, безпосередньо, без використання регулярного вираження:
x= '$123.45M'
float(''.join(c for c in x if (c.isdigit() or c =='.'))
123.45
Ви можете змінити крапку для коми через залежність від ваших потреб.
зміни для цього, якщо ви знаєте, що ваш номер є цілим числом
x='$1123'
int(''.join(c for c in x if c.isdigit())
1123 рік