Набір символів - це набір символів та кодувань. Звірка являє собою набір правил для порівняння символів в наборі символів. Зробимо чітке розмежування на прикладі уявного набору символів.
Припустимо, у нас є алфавіт з чотирма літерами: " A
", " B
", " a
", " b
". Кожній букві ми даємо число: " A
" = 0, " B
" = 1, " a
" = 2, " b
" = 3. Буква " A
" є символом, число 0 - кодуванням для " A
", а комбінація всіх чотири літери та їх кодування - це набір символів .
Припустимо, ми хочемо порівняти два значення рядка " A
" і " B
". Найпростіший спосіб зробити це - подивитися кодування: 0 для " A
" і 1 для " B
". Оскільки 0 менше 1, ми кажемо, що " A
" менше, ніж " B
". Щойно ми зробили, це застосувати порівняння до набору символів. Порівняння - це набір правил (у цьому випадку лише одне правило): "порівняйте кодування". Цей найпростіший з усіх можливих зіставлень ми називаємо двійковим порівнянням.
Але що робити, якщо ми хочемо сказати, що малі та великі літери рівнозначні? Тоді ми мали б принаймні два правила: (1) трактувати малі літери " a
" і " b
" як еквівалентні " A
" і " B
"; (2) потім порівняйте кодування. Ми називаємо це співставленням, що не враховує регістр . Це трохи складніше, ніж двійкове порівняння.
У реальному житті більшість наборів символів має багато символів: не лише " A
" і " B
", але цілі алфавіти, іноді кілька алфавітів або східні системи письма з тисячами символів, а також багато спеціальних символів та розділових знаків. Також у реальному житті у більшості посилань є багато правил, не тільки щодо того, чи слід розрізняти буквений лист, але й щодо того, чи слід розрізняти наголоси ("наголос" - знак, прикріплений до символу, як у німецькій " Ö
"), і для багатозначних символів відображення (наприклад, правило " Ö
" = " OE
" в одному з двох німецьких зіставлень).