Як накладати нулі на рядок?


1442

Що таке пітонічний спосіб прокладки числового рядка з нулями зліва, тобто щоб числовий рядок мав конкретну довжину?

Відповіді:


2390

Струни:

>>> n = '4'
>>> print(n.zfill(3))
004

А для номерів:

>>> n = 4
>>> print(f'{n:03}') # Preferred method, python >= 3.6
004
>>> print('%03d' % n)
004
>>> print(format(n, '03')) # python >= 2.6
004
>>> print('{0:03d}'.format(n))  # python >= 2.6 + python 3
004
>>> print('{foo:03d}'.format(foo=n))  # python >= 2.6 + python 3
004
>>> print('{:03d}'.format(n))  # python >= 2.7 + python3
004

Документація щодо форматування рядків .


3
Невідомий код формату 'd' для об’єкта типу 'float'.
Cees Timmerman

7
Коментарі python >= 2.6невірні. Цей синтаксис не працює python >= 3. Ви можете це змінити python < 3, але чи можу я запропонувати замість цього завжди використовувати дужки та зовсім пропускати коментарі (заохочуючи рекомендоване використання)?
Джейсон Р. Кумбс

4
Зауважте, що вам не потрібно нумерувати рядки формату: '{:03d} {:03d}'.format(1, 2)неявно призначає значення в порядку.
Дракон

1
@ JasonR.Coombs: Я припускаю, що ви мали на увазі printтвердження, коли воно повинно бути printфункцією на Python 3? Я редагував у паренах; оскільки друкується лише одна річ, вона працює однаково і зараз на Py2 та Py3.
ShadowRanger


353

Просто використовуйте метод rjust об'єкта string.

Цей приклад зробить рядок довжиною 10 символів, за потреби проклавши.

>>> t = 'test'
>>> t.rjust(10, '0')
>>> '000000test'

123

Крім того zfill, ви можете використовувати загальне форматування рядків:

print(f'{number:05d}') # (since Python 3.6), or
print('{:05d}'.format(number)) # or
print('{0:05d}'.format(number)) # or (explicit 0th positional arg. selection)
print('{n:05d}'.format(n=number)) # or (explicit `n` keyword arg. selection)
print(format(number, '05d'))

Документація для форматування рядків і f-рядків .


3
PEP 3101 не зазначає, що% будь-яким чином застаряється.
zwirbeltier

@zwirbeltier PEP 3101 пояснює, як використовувати формат, це те, що я мав на увазі.
Конрад Рудольф

4
"EDIT" все ще констатує "... цей спосіб форматування застарілий ...".
zwirbeltier

1
@zwirbeltier Так, це застаріло. Але це не прямо сказано в ПЕП. У документації, однак, сказано, що використовувати це formatзамість цього, і люди, як правило, інтерпретують це як намір депресувати.
Конрад Рудольф

1
@LarsH Дякую, що знайшли це. Тож вони сильно відстають від розкладу (Python 3.1 не в майбутньому, це в далекому минулому). Враховуючи це, я все ще не думаю, що відповідь була оманливою, просто не суворо оновлювалась щоразу, коли графік розробки Python змінювався в новому, довільному напрямку. У всякому разі, це дало мені можливість зняти з моєї відповіді якісь нерелевантні та застарілі речі.
Конрад Рудольф

63

Для Python 3.6+ з використанням f-рядків:

>>> i = 1
>>> f"{i:0>2}"  # Works for both numbers and strings.
'01'
>>> f"{i:02}"  # Works only for numbers.
'01'

Для Python 2 до Python 3.5:

>>> "{:0>2}".format("1")  # Works for both numbers and strings.
'01'
>>> "{:02}".format(1)  # Works only for numbers.
'01'


39

str(n).zfill(width)буде працювати з strings, ints, floats ... і є Python 2. x та 3. x сумісний:

>>> n = 3
>>> str(n).zfill(5)
'00003'
>>> n = '3'
>>> str(n).zfill(5)
'00003'
>>> n = '3.0'
>>> str(n).zfill(5)
'003.0'

23

Для тих, хто прийшов сюди, щоб зрозуміти і не просто швидко відповісти. Я роблю це спеціально для тимчасових рядків:

hour = 4
minute = 3
"{:0>2}:{:0>2}".format(hour,minute)
# prints 04:03

"{:0>3}:{:0>5}".format(hour,minute)
# prints '004:00003'

"{:0<3}:{:0<5}".format(hour,minute)
# prints '400:30000'

"{:$<3}:{:#<5}".format(hour,minute)
# prints '4$$:3####'

Символи "0" на те, що замінити символами "2" накладки, за замовчуванням - порожній пробіл

">" символи вирівнюють усі символи 2 "0" зліва від рядка

":" символізує format_spec


23

Що є найбільш пітонічним способом прокладки числового рядка з нулями зліва, тобто числовий рядок має конкретну довжину?

str.zfill спеціально призначений для цього:

>>> '1'.zfill(4)
'0001'

Зауважте, що він спеціально призначений для обробки числових рядків відповідно до запиту і переміщує a +або -на початок рядка:

>>> '+1'.zfill(4)
'+001'
>>> '-1'.zfill(4)
'-001'

Ось допомога на тему str.zfill:

>>> help(str.zfill)
Help on method_descriptor:

zfill(...)
    S.zfill(width) -> str

    Pad a numeric string S with zeros on the left, to fill a field
    of the specified width. The string S is never truncated.

Продуктивність

Це також найефективніші з альтернативних методів:

>>> min(timeit.repeat(lambda: '1'.zfill(4)))
0.18824880896136165
>>> min(timeit.repeat(lambda: '1'.rjust(4, '0')))
0.2104538488201797
>>> min(timeit.repeat(lambda: f'{1:04}'))
0.32585487607866526
>>> min(timeit.repeat(lambda: '{:04}'.format(1)))
0.34988890308886766

Краще порівняти яблука з яблуками за %методом (зауважте, що це насправді повільніше), який інакше попередньо обчислить:

>>> min(timeit.repeat(lambda: '1'.zfill(0 or 4)))
0.19728074967861176
>>> min(timeit.repeat(lambda: '%04d' % (0 or 1)))
0.2347015216946602

Впровадження

Трохи перекопавши, я знайшов реалізацію zfillметоду в Objects/stringlib/transmogrify.h:

static PyObject *
stringlib_zfill(PyObject *self, PyObject *args)
{
    Py_ssize_t fill;
    PyObject *s;
    char *p;
    Py_ssize_t width;

    if (!PyArg_ParseTuple(args, "n:zfill", &width))
        return NULL;

    if (STRINGLIB_LEN(self) >= width) {
        return return_self(self);
    }

    fill = width - STRINGLIB_LEN(self);

    s = pad(self, fill, 0, '0');

    if (s == NULL)
        return NULL;

    p = STRINGLIB_STR(s);
    if (p[fill] == '+' || p[fill] == '-') {
        /* move sign to beginning of string */
        p[0] = p[fill];
        p[fill] = '0';
    }

    return s;
}

Давайте переглянемо цей код С.

Він спочатку позиційно аналізує аргумент, тобто не дозволяє аргументи ключових слів:

>>> '1'.zfill(width=4)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: zfill() takes no keyword arguments

Потім він перевіряє, чи однакової довжини чи довшої, і в цьому випадку повертає рядок.

>>> '1'.zfill(0)
'1'

zfillвикликів pad(ця padфункція також викликається ljust, rjustі centerа). Це, в основному, копіює вміст у новий рядок і заповнює прокладку.

static inline PyObject *
pad(PyObject *self, Py_ssize_t left, Py_ssize_t right, char fill)
{
    PyObject *u;

    if (left < 0)
        left = 0;
    if (right < 0)
        right = 0;

    if (left == 0 && right == 0) {
        return return_self(self);
    }

    u = STRINGLIB_NEW(NULL, left + STRINGLIB_LEN(self) + right);
    if (u) {
        if (left)
            memset(STRINGLIB_STR(u), fill, left);
        memcpy(STRINGLIB_STR(u) + left,
               STRINGLIB_STR(self),
               STRINGLIB_LEN(self));
        if (right)
            memset(STRINGLIB_STR(u) + left + STRINGLIB_LEN(self),
                   fill, right);
    }

    return u;
}

Після виклику pad, zfillрухається будь спочатку попереднє +або -на початку рядка.

Зауважте, що початковий рядок насправді є числовим: не потрібно:

>>> '+foo'.zfill(10)
'+000000foo'
>>> '-foo'.zfill(10)
'-000000foo'

для продуктивності, чи є випадки, коли f-рядки краще, включаючи випадки використання для python2 vs python3? також, я думаю, що zfill не є загальним, це допоможе вашій відповіді мати посилання на документи
срібло

@eladsilver залежить від вашого наміру, маючи на увазі поведінку з +і -, і я додав посилання на документи!
Зал Аарона

17
width = 10
x = 5
print "%0*d" % (width, x)
> 0000000005

Дивіться документацію щодо друку для всіх захоплюючих деталей!

Оновлення для Python 3.x (через 7.5 років)

Останнім рядком має бути:

print("%0*d" % (width, x))

Тобто print()тепер це функція, а не твердження. Зауважте, що я все ще віддаю перевагу printf()стилю Old School, тому що, IMNSHO, він читається краще, і тому що, гм, я використовую це позначення з січня 1980 року. Щось ... старі собаки .. щось щось ... нові трюки.


з 1980 року ... тож ви 60-річний програміст ... чи не могли б ви пояснити, як "%0*d" % (width, x)інтерпретується python?
Лі

15

Під час використання Python >= 3.6найчистішим способом є використання f-рядків із форматуванням рядків :

>>> s = f"{1:08}"  # inline with int
>>> s
'00000001'
>>> s = f"{'1':0>8}"  # inline with str
>>> s
'00000001'
>>> n = 1
>>> s = f"{n:08}"  # int variable
>>> s
'00000001'
>>> c = "1"
>>> s = f"{c:0>8}"  # str variable
>>> s
'00000001'

Я вважаю за краще форматування за допомогою int, оскільки лише тоді знак обробляється правильно:

>>> f"{-1:08}"
'-0000001'

>>> f"{1:+08}"
'+0000001'

>>> f"{'-1':0>8}"
'000000-1'

Дякуємо за новий приклад синтаксису. Заповнити char 'x' буде: v = "A18"; s = f '{v: x> 8}' + "|"; або s = v.ljust (8, "x") + "|";
Чарлі

@Charlie 木匠 Це було питання до мене чи просто заява?
ruohola

просто заява. протестував ще деяке використання.
Чарлі

4

Для поштових індексів, збережених як цілі числа:

>>> a = 6340
>>> b = 90210
>>> print '%05d' % a
06340
>>> print '%05d' % b
90210

1
Ви маєте рацію, і мені все одно подобається ваша пропозиція щодо zfill

3

Швидке порівняння часу:

setup = '''
from random import randint
def test_1():
    num = randint(0,1000000)
    return str(num).zfill(7)
def test_2():
    num = randint(0,1000000)
    return format(num, '07')
def test_3():
    num = randint(0,1000000)
    return '{0:07d}'.format(num)
def test_4():
    num = randint(0,1000000)
    return format(num, '07d')
def test_5():
    num = randint(0,1000000)
    return '{:07d}'.format(num)
def test_6():
    num = randint(0,1000000)
    return '{x:07d}'.format(x=num)
def test_7():
    num = randint(0,1000000)
    return str(num).rjust(7, '0')
'''
import timeit
print timeit.Timer("test_1()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_2()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_3()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_4()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_5()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_6()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_7()", setup=setup).repeat(3, 900000)


> [2.281613943830961, 2.2719342631547077, 2.261691106209631]
> [2.311480238815406, 2.318420542148333, 2.3552384305184493]
> [2.3824197456864304, 2.3457239951596485, 2.3353268829498646]
> [2.312442972404032, 2.318053102249902, 2.3054072168069872]
> [2.3482314132374853, 2.3403386400002475, 2.330108825844775]
> [2.424549090688892, 2.4346475296851438, 2.429691196530058]
> [2.3259756401716487, 2.333549212826732, 2.32049893822186]

Я робив різні тести різних повторів. Відмінності не величезні, але у всіх тестах zfillрішення було найшвидшим.


1

Іншим підходом було б використання розуміння списку з перевіркою умови на тривалість. Нижче демонстрація:

# input list of strings that we want to prepend zeros
In [71]: list_of_str = ["101010", "10101010", "11110", "0000"]

# prepend zeros to make each string to length 8, if length of string is less than 8
In [83]: ["0"*(8-len(s)) + s if len(s) < desired_len else s for s in list_of_str]
Out[83]: ['00101010', '10101010', '00011110', '00000000']

0

Це теж добре:

 h = 2
 m = 7
 s = 3
 print("%02d:%02d:%02d" % (h, m, s))

тому вихід буде: "02:07:03"


-2

Ви також можете повторити "0", додати до нього str(n)і отримати найправіший зріз по ширині. Швидкий і брудний невеликий вираз.

def pad_left(n, width, pad="0"):
    return ((pad * width) + str(n))[-width:]

1
Це працює лише для позитивних цифр. Це стає трохи складніше, якщо ви хочете і негативів. Але цей вираз хороший для швидкої та брудної роботи, якщо ви не заперечуєте проти подібних речей.
J Lacar

Я абсолютно не маю уявлення, чому це спровоковано. Якщо це справа, вона не працює на від'ємних числах досить справедливо, але переважна причина, яка залишила б колодки з нулями, - це ідентифікаційні номери. Якщо у вас є негативні ідентифікаційні номери, я думаю, у вас є більші проблеми ... чи очікуєте ви, що ваш килимок має форму "00000-1234"? або '-000001234'? Чесно кажучи, на це питання працює ця відповідь, вона проста, чиста, розширювана. Це може бути не zfill, але якщо він відповідає на запитання, його слід анулювати.
TastySlowCooker
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.