Наскільки унікальним є uniqid?

Question 1

Це питання насправді не є проблемою пошуку рішення, це більше питання простої цікавості. Функція PHP uniqid має більш ентропійний прапорець, щоб зробити вихід "більш унікальним". Це змусило мене задуматися, наскільки ймовірно, що ця функція дасть однаковий результат більше одного разу, коли more_entropy є істинним, порівняно з тим, коли це не так. Іншими словами, наскільки унікальним є uniqid, коли активовано функцію more_entropy, порівняно з тим, коли вона вимкнена? Чи є якісь недоліки постійного ввімкнення more_entropy?

Question 2

Оновлення, березень 2014 року:

По-перше, важливо зауважити, що uniqidце трохи помилково, оскільки це не гарантує унікальний ідентифікатор.

Відповідно до документації PHP :

УВАГА!

Ця функція не створює випадкових або непередбачуваних рядків. Цю функцію не можна використовувати в цілях безпеки. Використовуйте криптографічно захищені випадкові функції / генератори та криптографічно захищені хеш-функції для створення непередбачуваного захищеного ідентифікатора.

І

Ця функція не генерує криптографічно захищені маркери, насправді без передачі будь-яких додаткових параметрів повернене значення мало відрізняється від мікрочасу () . Якщо вам потрібно створити криптографічно захищені маркери, використовуйте openssl_random_pseudo_bytes () .

Встановлення більш ентропії в true генерує більш унікальне значення, однак час виконання довший (хоча і в незначній мірі), згідно з документами:

Якщо встановити значення TRUE, uniqid () додасть додаткову ентропію (за допомогою комбінованого лінійного конгруентного генератора) в кінці поверненого значення, що збільшує ймовірність того, що результат буде унікальним.

Зверніть увагу на рядок, increases the likelihood that the result will be uniqueа не той, що є гарантом унікальності.

Ви можете "нескінченно" прагнути до унікальності, до певної міри, і вдосконалювати, використовуючи будь-яку кількість процедур шифрування, додавання солей тощо - це залежить від мети.

Я рекомендую переглянути коментарі до основної теми PHP, зокрема:

http://www.php.net/manual/en/function.uniqid.php#96898

http://www.php.net/manual/en/function.uniqid.php#96549

http://www.php.net/manual/en/function.uniqid.php#95001

Я б порадив розібратися, навіщо потрібна унікальність, це для безпеки (тобто для додавання до процедури шифрування / скремблювання)? Крім того, наскільки унікальним він повинен бути? Нарешті, подивіться на врахування швидкості. Придатність буде змінюватися з урахуванням основних міркувань.

Question 3

Речі унікальні лише в тому випадку, якщо ви перевірите, що вони ще не існують. Не має значення, яку функцію ви використовуєте для створення "випадкового" рядка або ідентифікатора - якщо ви не переконайтесь, що це не дублікат, то завжди є така можливість;;)

Хоча uniqid базується на поточному часі, попереджувальна примітка все ще застосовується - це лише залежить від того, де ви будете використовувати ці "унікальні ідентифікатори". Підказка до всього цього полягає там, де сказано "більш унікальний". Унікальний є унікальний є унікальний. Як можна отримати щось більш-менш унікальне, мене трохи бентежить!

Перевірка, як зазначено вище, та поєднання всього цього дозволить вам отримати щось наближене до унікальності, але все це відносно місця використання ключів та контексту. Сподіваюся, це допоможе!

Question 4

З дискусій про функцію на сайті керівництва PHP:

Як зазначають інші нижче, без префікса та без "доданої ентропії" ця функція просто повертає мітку часу UNIX з доданим мікросекундним лічильником як шістнадцяткове число; це більш-менш просто мікрочас () у формі hexit.

[...]

Також варто зауважити, що оскільки microtime () працює лише в системах, які мають gettimeofday ()> present, яких Windows спочатку НЕ МОЖЕ, uniqid () може дати лише часову мітку UNIX з роздільною здатністю в середовищі Windows.

Іншими словами, без "more_entropy" функція абсолютно жахлива і ніколи не повинна використовуватися, точка. Кодуючи документацію, прапор використовуватиме "комбінований лінійний конгруентний генератор" для "додавання ентропії". Ну, це досить слабкий RNG. Тому я повністю пропустив би цю функцію і використав би щось на основі mt_rand з хорошим насінням для речей, що не стосуються безпеки, і SHA-256 для речей, які є.

Question 5

Без прапора more_unique він повертає мітку часу unix з лічильником мікросекунд, тому, якщо два виклики здійснюються в одну і ту ж мікросекунду, вони повернуть той самий "унікальний" ідентифікатор.

Звідси питання про те, наскільки це можливо. Відповідь - не дуже, але не до суперечливої міри. Якщо вам потрібен унікальний ідентифікатор, і ви часто його генеруєте (або працюєте з даними, сформованими в інших місцях), не розраховуйте на те, що він буде абсолютно унікальним.

Question 6

Відповідним бітом вихідного коду є

if (more_entropy) {
    uniqid = strpprintf(0, "%s%08x%05x%.8F", prefix, sec, usec, php_combined_lcg() * 10);
} else {
    uniqid = strpprintf(0, "%s%08x%05x", prefix, sec, usec);
}

Тож more_entropyдодає дев’ять дещо випадкових десяткових цифр ( php_combined_lcg()повертає значення в (0,1)) - це 29,9 біт ентропії, вершини (насправді, мабуть, менше, оскільки LCG не є криптографічно захищеним генератором псевдовипадкових чисел).