Друкувати рядок у вигляді шістнадцяткових байтів?


155

У мене є цей рядок: Hello world !!і я хочу роздрукувати його за допомогою Python як 48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21.

hex() працює лише для цілих чисел.

Як це можна зробити?


Якщо ідея полягає у поверненні лише двозначних шестизначних значень, то це питання передбачає використання рядків байтів (тобто Python 2 strабо Python 3 bytestring), оскільки не існує однозначного перетворення символу в ціле число в 0… 255. Таким чином, символьні рядки (Python 2 unicodeта Python 3 str) спочатку потребують деякого кодування, перш ніж бути конвертованими в цьому шістнадцятковому форматі. Відповідь Аарона Холла це ілюструє це.
Ерік О Лебігот

Відповіді:


227

Ви можете перетворити рядок у генератор int, застосувати шістнадцяткове форматування для кожного елемента та інтеркалювати з роздільником:

>>> s = "Hello world !!"
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21

3
Зауважте, що в python3 концепція друку strшістнадцяткових справді не має сенсу; ви хочете надрукувати bytesоб’єкт як шістнадцятковий (перетворити strна bytesвиклик .encode()).
mic_e

8
Фактично, це створює недійсний вихід у python3: ":".join("{:02x}".format(ord(c)) for c in 'løl')повертає '6c:f8:6c', при цьому ":".join("{:02x}".format(c) for c in 'løl'.encode())створює правильне представлення utf-8 '6c:c3:b8:6c'.
mic_e

2
Це питання та відповіді, припускають, що ваш текст ніколи не містить символів, що не належать до ASCII. Якщо вхід може містити такі речі , як смайлики або нелатинські системи на основі письменництва, ви можете захотіти використовувати ":".join("{:04x}".format(ord(c)) for c in s)(замінює 02xз 04xдо нульової майданчику кожному номера з 4 цифр) замість
Boris

@mic_e Чому це? Скапі на це посилається, коли ви спробуєте це у вбудованому перекладачі. WARNING: Calling str(pkt) on Python 3 makes no sense!
sherrellbc

157
':'.join(x.encode('hex') for x in 'Hello World!')

3
Як це зробити в python3?
h__

6
@hyh: h = binascii.hexlify(b"Hello world !!") to get hex string. b":".join(h[i:i+2] for i in range(0, len(h), 2))вставляти ':'після кожні два шістнадцяткові цифри
jfs

2
Не працює на Python 3.LookupError: 'hex' is not a text encoding; use codecs.encode() to handle arbitrary codecs
Борис

55

Для Python 2.x:

':'.join(x.encode('hex') for x in 'Hello World!')

Код, наведений вище, не працюватиме з Python 3.x , для 3.x, код нижче буде працювати:

':'.join(hex(ord(x))[2:] for x in 'Hello World!')

1
слід також зазначити, що пізніше ТАКОЖ буде працювати з python2.x І він також буде працювати для персонажів, що не мають
асацій

1
Але також зауважте, що останній не прошиває провідні нулі: hex (ord ("\ x00")) [2:] є "0" і "\ x00" .encode ("hex") == "00"
Will Will Daniels

3
Чому ви вирішили опублікувати це як нову відповідь через кілька місяців після того, як обидва ці рішення були запропоновані іншими користувачами? Якщо суть полягала в з'ясуванні сумісності версій, було б більше сенсу пропонувати зміни до існуючих відповідей.
Повітря

2
Як було зазначено в іншому місці, ця відповідь навіть не є правильною, коли виходите за рамки ascii і вважаємо unicode. ':'. join (hex (ord (x)) [2:] для x в 'løl') неправильно друкує '6c: f8: 6c', тоді як правильний вихід '6c: c3: b8: 6c'.
mcduffee

23

Ще одна відповідь у двох рядках, яку деяким може бути легше читати, та допомагає при налагодженні розривів рядків або інших непарних символів у рядку:

Для Python 2.7

for character in string:
    print character, character.encode('hex')

Для Python 3.7 (не тестується на всіх версіях 3)

for character in string:
    print(character, character.encode('utf-8').hex())

Це не працює як у Python 3.6.8 (принаймні): "hex" не є кодуванням рядків. codecs.encode(<bytestring>, "hex")але працює, хоча.
Ерік О Лебігот

2
Ах, приємно дякую за інформацію ... так, це точно було написано для Python 2.7. Я оновлю свою відповідь, щоб включити, як це зробити для Python 3.7.
copeland3300

Підтверджено, Python 3.7.6: import sys; s="Déjà vu Besançon,Lupiñén,Šiauliai,Großräschen,Łódź,Аша,广东省,LA"; for c in s:; w=sys.stdout.write(c+":"+c.encode('utf-8').hex()+"||"); (вихід)D:44||é:c3a9||j:6a||à:c3a0|| :20||v:76||u:75|| :20||B:42||e:65||s:73||a:61||n:6e||ç:c3a7||o:6f||n:6e||,:2c||L:4c||u:75||p:70||i:69||ñ:c3b1||é:c3a9||n:6e||,:2c||Š:c5a0||i:69||a:61||u:75||l:6c||i:69||a:61||i:69||,:2c||G:47||r:72||o:6f||ß:c39f||r:72||ä:c3a4||s:73||c:63||h:68||e:65||n:6e||,:2c||Ł:c581||ó:c3b3||d:64||ź:c5ba||,:2c||А:d090||ш:d188||а:d0b0||,:2c||广:e5b9bf||东:e4b89c||省:e79c81||,:2c||L:4c||A:41||
bballdave025

20

Деякі доповнення до відповіді Федора Гоголєва:

По-перше, якщо рядок містить символи, "ASCII код" нижче 10, вони не відображатимуться як потрібно. У цьому випадку правильний формат повинен бути {:02x}:

>>> s = "Hello unicode \u0005 !!"
>>> ":".join("{0:x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:5:20:21:21'
                                           ^

>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:05:20:21:21'
                                           ^^

По-друге, якщо ваша "рядок" насправді є "байт-рядком" - а оскільки різниця має значення в Python 3 - ви можете віддати перевагу наступному:

>>> s = b"Hello bytes \x05 !!"
>>> ":".join("{:02x}".format(c) for c in s)
'48:65:6c:6c:6f:20:62:79:74:65:73:20:05:20:21:21'

Зверніть увагу, немає необхідності в перетворенні вищевказаного коду, оскільки об'єкти байтів визначаються як "незмінна послідовність цілих чисел у діапазоні 0 <= x <256" .


11

Друкувати рядок у вигляді шістнадцяткових байтів?

Прийнята відповідь дає:

s = "Hello world !!"
":".join("{:02x}".format(ord(c)) for c in s)

повертає:

'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21'

Прийнята відповідь працює лише до тих пір, поки ви використовуєте байти (в основному символи ascii). Але якщо ви використовуєте unicode, наприклад:

a_string = u"Привет мир!!" # "Prevyet mir", or "Hello World" in Russian.

Вам потрібно якось перетворити в байти.

Якщо ваш термінал не приймає цих символів, ви можете декодувати з UTF-8 або використовувати імена (щоб ви могли вставити і запустити код разом зі мною):

a_string = (
    "\N{CYRILLIC CAPITAL LETTER PE}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER VE}"
    "\N{CYRILLIC SMALL LETTER IE}"
    "\N{CYRILLIC SMALL LETTER TE}"
    "\N{SPACE}"
    "\N{CYRILLIC SMALL LETTER EM}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{EXCLAMATION MARK}"
    "\N{EXCLAMATION MARK}"
)

Отже, ми бачимо це:

":".join("{:02x}".format(ord(c)) for c in a_string)

повертає

'41f:440:438:432:435:442:20:43c:438:440:21:21'

поганий / несподіваний результат - це кодові пункти, які поєднують, щоб зробити графеми, які ми бачимо в Unicode, від консорціуму Unicode - представляючи мови у всьому світі. Це НЕ як ми на самому справі зберігати цю інформацію , так що може бути інтерпретовано іншими джерелами, однако.

Щоб дозволити іншому джерелу використовувати ці дані, зазвичай нам потрібно було б перетворити в кодування UTF-8, наприклад, зберегти цю рядок у байтах на диску або опублікувати в html. Тож нам потрібно, що кодування для перетворення точок коду в одиниці коду UTF-8 - в Python 3, ordне потрібно, оскільки bytesце ітерабелі цілих чисел:

>>> ":".join("{:02x}".format(c) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

Або, можливо, більш елегантно, використовуючи нові f-рядки (доступні лише в Python 3):

>>> ":".join(f'{c:02x}' for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

У Python 2 перейдіть cдо ordпершого, тобто ord(c)- більше прикладів:

>>> ":".join("{:02x}".format(ord(c)) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
>>> ":".join(format(ord(c), '02x') for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

1
@ not2qubit, будь ласка, спробуйте ці приклади ще раз - мені знадобилося небагато часу, щоб вирішити відмінності між Python 2 та 3, і, мабуть, я спочатку писав їх лише для Python 2. І дякую за відповідь QA'ing!
Аарон Холл

Так, це і вдалося. Дякую!
not2qubit

8

Ви можете використовувати hexdumps

import hexdump
hexdump.dump("Hello World", sep=":")

(додайте, .lower()якщо вам потрібні малі регістри). Це працює як для Python 2, так і для 3.


Також проблема, з якою я зіткнувся, якщо у вас є проблеми з установкою hexdump або будь-якого іншого пакету, це звичайно через налаштування проксі, спробуйте запустити pip з опцією проксі pip install -U hexdump --proxy http://proxy.address:port
Eduard Florinescu

На самом деле я зробив помилку, використовуючи sudoз pip, які переплуталися pacman...
Тобіас Kienzler

6

Використовуючи функцію map та lambda, можна створити список шістнадцяткових значень, які можна надрукувати (або використовувати для інших цілей)

>>> s = 'Hello 1 2 3 \x01\x02\x03 :)'

>>> map(lambda c: hex(ord(c)), s)
['0x48', '0x65', '0x6c', '0x6c', '0x6f', '0x20', '0x31', '0x20', '0x32', '0x20', '0x33', '0x20', '0x1', '0x2', '0x3', '0x20', '0x3a', '0x29']

[hex(ord(c)) for c in s]
Борис

2

Це можна зробити наступними способами:

from __future__ import print_function
str = "Hello World !!"
for char in str:
    mm = int(char.encode('hex'), 16)
    print(hex(mm), sep=':', end=' ' )

Вихід цього буде у шістнадцятковій формі:

0x48 0x65 0x6c 0x6c 0x6f 0x20 0x57 0x6f 0x72 0x6c 0x64 0x20 0x21 0x21


де я знаходжу майбутнє
tofutim

Для подальшої довідки __future__- це стандартна бібліотека, доступна в останніх версіях Python 2, яка може бути використана для створення функцій, як правило, лише в Python 3, сумісному ззаду. У цій відповіді використовується print(text)функція "функції друку", яка замінює print textсинтаксис з Python 2. Дивіться документи Python .
Ерік Рід

2

Трохи більш загальне для тих, хто не переймається Python3 або колонами:

from codecs import encode

data = open('/dev/urandom', 'rb').read(20)
print(encode(data, 'hex'))      # data

print(encode(b"hello", 'hex'))  # string

0

Використання base64.b16encodeв python2 (його вбудований)

>>> s = 'Hello world !!'
>>> h = base64.b16encode(s)
>>> ':'.join([h[i:i+2] for i in xrange(0, len(h), 2)]
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'

Це не працює. Що ви використовуєте для імпорту, а чому не використовувати .decode()?
not2qubit

0

Просто для зручності, дуже просто.

def hexlify_byteString(byteString, delim="%"):
    ''' very simple way to hexlify a bytestring using delimiters '''
    retval = ""
    for intval in byteString:
        retval += ( '0123456789ABCDEF'[int(intval / 16)])
        retval += ( '0123456789ABCDEF'[int(intval % 16)])
        retval += delim
    return( retval[:-1])

hexlify_byteString(b'Hello World!', ":")
# Out[439]: '48:65:6C:6C:6F:20:57:6F:72:6C:64:21'

0

для чогось, що пропонує більшу ефективність ''.format(), ви можете використовувати це:

>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in 'Hello World !!' )
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
>>> 
>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in b'Hello World !!' )
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
>>> 

Вибачте, це не могло виглядати приємніше,
було б добре, якби можна було просто зробити'%02x'%v , але це вимагає лише int ...
але ви будете застрягли в рядках байтів b''без логіки для вибору ord(v).

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.