Як і в попередній відповіді, набір символів - це набір символів (літери, цифри, ідеограми тощо), присвоєний номеру; щоб мати можливість їх бачити, ви повинні мати шрифт (маленькі «малюнки», які ми читаємо). Вони мали важливе значення за допомогою LatinX, оскільки для кожного X однакове число (байт) могло означати різний символ.
Сьогодні важливіше вибрати кодування: стандарт - це UTF-8, найуспішніше представлення Unicode (сумісне з ASCII, але настільки гнучке, що включає всю мову, навіть китайську та японську) та стандарт W3C. Іншими словами, вона включає всі набори символів.
Збір: це слово старомодної моди, що походить від латинської мови. Це означає: порівняйте копію (рукопис) з оригіналом, щоб знайти відмінності (помилки чи зміни). Раніше це було дуже корисно, але зараз це майже архаїзм, оскільки наші документи та книги написані на комп’ютерах, а копія завжди тотожна оригіналу. Приклад: в італійській (походить від латинської) дієслово "collazionare", але воно є в словниках, і його ніхто не використовує.
Отже, порівняння визначає поведінку операторів порівняння: =,>, <, <=,> = ...
Звичайно, ці оператори використовуються для того, щоб вирішити, чи два струни однакові, чи слово "більше", ніж інше, дуже важливо, якщо ми хочемо сортувати. Букви не в одному порядку для кожної мови, тому слово може бути більше, ніж інше за допомогою порівняння, але не використовувати інше. Див. [1] практичний приклад.
порівняння "бін" є найсуворішим: SELECT "b" = "B" => FALSE
посилання "ci" не враховує регістри: SELECT "b" = "B" => ІСТИНА
"загальні", як правило, ігнорують деякі відмінності: SELECT "a" = "à" => ІСТИНА
інші є специфічними для однієї або декількох мов. Приклад "шведський" (я не знаю, чому шведська мова часто є типовою)
Я все ще шукаю веб-сайт, де детально описано поведінку кожного зіставлення ... ці приклади пояснюються моїм досвідом.
[1] http://www.olcot.co.uk/sql-blogs/revid-difference-between-collation-sql_latin1_general_cp1_ci_as-and-latin1_general_ci_as