Формат UUID: 8-4-4-4-12 - Чому?


84

Чому UUID представлені у форматі "8-4-4-4-12" (цифри)? Я подивився навколо причини, але не можу знайти рішення, яке вимагає цього.

Приклад UUID, відформатований як шістнадцятковий рядок: 58D5E212-165B-4CA0-909B-C86B9CEE0111


11
Насправді, цей приклад шістнадцяткового рядка є неправильним. Специфікація UUID вимагає, щоб шістнадцятковий рядок, що представляє значення UUID, повинен бути в нижньому регістрі . Специфікація також вимагає реалізації, щоб мати можливість проаналізувати рядок верхнього або змішаного регістру, але можна генерувати лише малі літери. На жаль, загальноприйняті реалізації порушують це правило, включаючи правила Apple, Microsoft та інших.
Василь Бурке

1
Цікавий Василь, дякую
Фідель

Відповіді:


65

Він розділений time, version, clock_seq_hi, clock_seq_lo, node, як зазначено в наступному RFC.

З IETF RFC4122:

4.1.2.  Layout and Byte Order

   To minimize confusion about bit assignments within octets, the UUID
   record definition is defined only in terms of fields that are
   integral numbers of octets.  The fields are presented with the most
   significant one first.

   Field                  Data Type     Octet  Note
                                        #

   time_low               unsigned 32   0-3    The low field of the
                          bit integer          timestamp

   time_mid               unsigned 16   4-5    The middle field of the
                          bit integer          timestamp

   time_hi_and_version    unsigned 16   6-7    The high field of the
                          bit integer          timestamp multiplexed
                                               with the version number  

   clock_seq_hi_and_rese  unsigned 8    8      The high field of the
   rved                   bit integer          clock sequence
                                               multiplexed with the
                                               variant

   clock_seq_low          unsigned 8    9      The low field of the
                          bit integer          clock sequence

   node                   unsigned 48   10-15  The spatially unique
                          bit integer          node identifier

   In the absence of explicit application or presentation protocol
   specification to the contrary, a UUID is encoded as a 128-bit object,
   as follows:

   The fields are encoded as 16 octets, with the sizes and order of the
   fields defined above, and with each field encoded with the Most
   Significant Byte first (known as network byte order).  Note that the
   field names, particularly for multiplexed fields, follow historical
   practice.

   0                   1                   2                   3
    0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |                          time_low                             |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |       time_mid                |         time_hi_and_version   |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |clk_seq_hi_res |  clk_seq_low  |         node (0-1)            |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |                         node (2-5)                            |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

11
Чому мітку часу розділили на три частини?
user253751

4
Спосіб створення полів залежить від версії UUID. Переважний метод не використовує час, оскільки це показує час створення ідентифікатора (потенційна проблема безпеки). en.wikipedia.org/wiki/…
Пмонт

1
@pmont “Бажаний”?
Basil Bourque

2
@brocoli Я повинен не погодитися. V4 залежить від криптографічно сильного генератора випадкових чисел, який набагато складніше будувати якісно, ​​ніж просто захоплення MAC-адреси , поточного моменту та збільшення довільного числа, як видно з V1 UUID. Більше того, реалізації V1, як правило, мають відкритий код і побудовані багато років тому з великим використанням у всій галузі, зараз вже зношені. Стверджувати, що V1 "схильний до часткової невдачі", просто безглуздо. UUID V1 - це остання частина вашої системи, де вам потрібно турбуватися про несправність.
Basil Bourque

2
@BasilBourque Однією з проблем, яку ви можете побачити зараз із розповсюдженням контейнерів та мережею контейнерів, є зіткнення MAC-адрес. Зазвичай контейнери та віртуальні машини витягують з обмеженого діапазону можливих MAC-адрес. IIRC Hyper-V за замовчуванням витягує лише з пулу 256 можливих MAC-адрес.
Натан Клейтон,

12

Формат визначено в IETF RFC4122 у розділі 3. Формат виводу визначений там, де сказано "UUID = ..."

3. - Шаблон реєстрації простору імен

Ідентифікатор простору імен: UUID Інформація про реєстрацію: Дата реєстрації: 2003-10-01

Заявлений реєстрант простору імен: JTC 1 / SC6 (Група доповідачів ASN.1)

Декларація синтаксичної структури: UUID - це ідентифікатор, унікальний як у просторі, так і в часі щодо простору всіх UUID. Оскільки UUID є фіксованим розміром і містить часове поле, значення можна перекидати (приблизно 3400 AD, залежно від конкретного використовуваного алгоритму). UUID може використовуватися для різних цілей, починаючи від позначення об’єктів надзвичайно коротким терміном служби і закінчуючи надійною ідентифікацією дуже стійких об’єктів у мережі.

  The internal representation of a UUID is a specific sequence of
  bits in memory, as described in Section 4.  To accurately
  represent a UUID as a URN, it is necessary to convert the bit
  sequence to a string representation.

  Each field is treated as an integer and has its value printed as a
  zero-filled hexadecimal digit string with the most significant
  digit first.  The hexadecimal values "a" through "f" are output as
  lower case characters and are case insensitive on input.

  The formal definition of the UUID string representation is
  provided by the following ABNF [7]:

  UUID                   = time-low "-" time-mid "-"
                           time-high-and-version "-"
                           clock-seq-and-reserved
                           clock-seq-low "-" node
  time-low               = 4hexOctet
  time-mid               = 2hexOctet
  time-high-and-version  = 2hexOctet
  clock-seq-and-reserved = hexOctet
  clock-seq-low          = hexOctet
  node                   = 6hexOctet
  hexOctet               = hexDigit hexDigit
  hexDigit =
        "0" / "1" / "2" / "3" / "4" / "5" / "6" / "7" / "8" / "9" /
        "a" / "b" / "c" / "d" / "e" / "f" /
        "A" / "B" / "C" / "D" / "E" / "F"

4

128 біт

Формат "8-4-4-4-12" призначений просто для читання людьми. UUID дійсно 128-бітове число.

Подумайте, що формат рядка вимагає подвоєння байтів, ніж 128-бітове число, коли воно зберігається або зберігається в пам'яті. Я б запропонував використовувати номер всередині, а коли його потрібно показати в інтерфейсі користувача або експортувати у файл, використовуйте формат рядка.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.