У мене є змінна списку python, яка містить рядки. Чи є функція python, яка може перетворити всі рядки за один прохід у малі і навпаки, великі регістри?
У мене є змінна списку python, яка містить рядки. Чи є функція python, яка може перетворити всі рядки за один прохід у малі і навпаки, великі регістри?
Відповіді:
Це можна зробити зі списком розумінь. Вони в основному мають форму [function-of-item for item in some-list]. Наприклад, для створення нового списку, де всі елементи мають нижній регістр (або верхній регістр у другому фрагменті), ви використовуєте:
>>> [x.lower() for x in ["A","B","C"]]
['a', 'b', 'c']
>>> [x.upper() for x in ["a","b","c"]]
['A', 'B', 'C']
Ви також можете використовувати mapфункцію:
>>> map(lambda x:x.lower(),["A","B","C"])
['a', 'b', 'c']
>>> map(lambda x:x.upper(),["a","b","c"])
['A', 'B', 'C']
list(map(lambda x:x.upper(),["a","b","c"]))
map(str.lower, ["A","B","C"])
Окрім легкого для читання (для багатьох людей), розуміння списку також виграють швидкісну гонку:
$ python2.6 -m timeit '[x.lower() for x in ["A","B","C"]]'
1000000 loops, best of 3: 1.03 usec per loop
$ python2.6 -m timeit '[x.upper() for x in ["a","b","c"]]'
1000000 loops, best of 3: 1.04 usec per loop
$ python2.6 -m timeit 'map(str.lower,["A","B","C"])'
1000000 loops, best of 3: 1.44 usec per loop
$ python2.6 -m timeit 'map(str.upper,["a","b","c"])'
1000000 loops, best of 3: 1.44 usec per loop
$ python2.6 -m timeit 'map(lambda x:x.lower(),["A","B","C"])'
1000000 loops, best of 3: 1.87 usec per loop
$ python2.6 -m timeit 'map(lambda x:x.upper(),["a","b","c"])'
1000000 loops, best of 3: 1.87 usec per loop
mapвиграє гонку, але нічого не робить :)
map(str.lower,["A","B","C"])найшвидший - python3.7.5
>>> map(str.lower,["A","B","C"])
['a', 'b', 'c']
str.upperщоб перетворити на великі регістри
Ознайомлення зі списком - як я це зробив, це "піфонічний" спосіб. Наступна стенограма показує, як перетворити список у верхній регістр, а потім назад у нижній:
pax@paxbox7:~$ python3
Python 3.5.2 (default, Nov 17 2016, 17:05:23)
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> x = ["one", "two", "three"] ; x
['one', 'two', 'three']
>>> x = [element.upper() for element in x] ; x
['ONE', 'TWO', 'THREE']
>>> x = [element.lower() for element in x] ; x
['one', 'two', 'three']
listв якості змінної імені не є найкращим вибором :)
listречей :)) Де ти думаєш, звідки ви отримали УФ, який нещодавно отримали? :)
Для цього зразка розуміння є найшвидшим
$ python -m timeit -s 's = ["один", "два", "три"] * 1000' '[x.upper for x in s]' 1000 петель, найкраще 3: 809 Usec на петлю $ python -m timeit -s 's = ["один", "два", "три"] * 1000' 'карта (str.upper, s)' 1000 петель, найкраще 3: 1,12 мсек за петлю $ python -m timeit -s 's = ["один", "два", "три"] * 1000' 'карта (лямбда x: x.upper (), s)' 1000 петель, найкраще 3: 1,77 мсек за петлю
Рішення:
>>> s = []
>>> p = ['This', 'That', 'There', 'is', 'apple']
>>> [s.append(i.lower()) if not i.islower() else s.append(i) for i in p]
>>> s
>>> ['this', 'that', 'there', 'is','apple']
Це рішення створить окремий список із малими елементами, незалежно від їх оригіналу. Якщо початковий регістр верхній, то list sзаголовок буде містити малі регістри відповідного елемента в list p. Якщо в початковому регістрі елемента списку вже є малі літери, list pто list sзастереження збереже корпус і збереже його в малому регістрі. Тепер ви можете використовувати list sзамість list p.
Якщо ваша мета полягає в узгодженні з іншим рядком шляхом перетворення за один прохід, ви також можете використовувати str.casefold().
Це корисно, якщо у вас є символи, які не мають права ascii, і збігаються з версіями ascii (наприклад, maße vs masse). Хоча str.lowerабо str.upperне вдасться в таких випадках str.casefold()пройти. Це доступно в Python 3, і ідея детально обговорюється з відповіддю https://stackoverflow.com/a/31599276/4848659 .
>>>str="Hello World";
>>>print(str.lower());
hello world
>>>print(str.upper());
HELLO WOLRD
>>>print(str.casefold());
hello world
Ви можете спробувати скористатися:
my_list = ['india', 'america', 'china', 'korea']
def capitalize_list(item):
return item.upper()
print(list(map(capitalize_list, my_list)))
Python3.6.8
In [1]: a = 'which option is the fastest'
In [2]: %%timeit
...: ''.join(a).upper()
762 ns ± 11.4 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
In [3]: %%timeit
...: map(lambda x:x.upper(), a)
209 ns ± 5.73 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
In [4]: %%timeit
...: map(str.upper, [i for i in a])
1.18 µs ± 11.3 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
In [5]: %%timeit
...: [i.upper() for i in a]
3.2 µs ± 64.1 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
Якщо вам потрібен рядок або список як вихід, а не ітератор (це для Python3), порівняйте ''.join(string).upper()варіант із цим:
In [10]: %%timeit
...: [i for i in map(lambda x:x.upper(), a)]
4.32 µs ± 112 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
Якщо ви намагаєтесь перетворити весь рядок у малі регістри списку, ви можете використовувати панди:
import pandas as pd
data = ['Study', 'Insights']
pd_d = list(pd.Series(data).str.lower())
вихід:
['study', 'insights']