Я побачив це запитання на пропозиції сайту «Типографія», і це мене неспокоїло, що я не знаю відповіді. Я завжди ставився до "гліфів" та "характеру" як до змінних.
Прочитавши пояснення на сторінці Модель кодування символів Unicode , моє розуміння приблизно таке:
- Персонажі визначаються за їх значенням у мові, гліфах, за їх зовнішнім виглядом . Отже, лігатура для естетичного поєднання
fi
- це один гліф, але два символи.
Отже, я вірю (будь ласка, виправте мене, якщо я помиляюся), що практична різниця полягатиме в наступному :
- Текстові аналізатори, які не зацікавлені в естетиці тексту, будуть читати гліфи як їхні відповідні символи. Так:
- Якби ви скопіювали та вставили текст, що містить гліфи, у звичайний текстовий редактор, гліфи перетворилися б на їхні відповідні символи (
fi
лігатурний гліф станеf
іi
) - Будь-яка добре створена автоматизована система, заснована на синтаксичному аналізі тексту (наприклад, сканери пошукової системи, зчитувачі екранів, перевірки орфографії) інтерпретували б гліфи як їхні відповідні символи.
- Один символ може мати безліч гліфів або наборів гліфів. Я хочу сказати, що один гліф може мати лише один символ, але це явно неправильно, оскільки є приклад на пов'язаній статті з 3-х гліфів та наборів гліфів, які, здається, відповідають кожному символу та набору символів. Я не зовсім розумію, як це могло б працювати: напевно, це означає, що буде траплятися непослідовність чи неоднозначність у тому, як інтерпретуються ці гліфи, залежно від інтерпретатора? (чи змінюється це залежно від мови чи шрифту?)
- Хоча веб-переглядачі гліфів (наприклад, той, який є в Illustrator), містять повний набір гліфів шрифту, карти символів (наприклад, карта символів Windows) містять лише символи, а не гліфи, які є декількома символами, як лігатури (чого я раніше не помічав)
- Якби ви скопіювали та вставили текст, що містить гліфи, у звичайний текстовий редактор, гліфи перетворилися б на їхні відповідні символи (
Я відчуваю, що я майже там, але я чітко неправильно зрозумів щось десь уздовж лінії: не лише те, що "Один гліф з декількома символами", але також, поведінка копіювання та вставки з лігатурами не зовсім те, чого я очікував:
- Скопіюйте лігатуру
fi
з Illustrator у це поле для введення: вставляється якfi
(два символи), як очікувалося. - Вставити код HTML для нього (
fi
) - відображається як лігатура, коли не знаходиться в блоці коду (fi - який у цьому шрифті не схожий на лігатуру, але ви побачите один, якщо спробувати вибрати лише половину з нього) і код, коли в кодовому блоці (fi
), як очікувалося. - Скопіюйте та вставте візуалізовану лігатуру без коду назад у поле введення: вставляє як символ лігатури, а візуалізує як лігатуру незалежно від того, перебуває вона у блоці коду чи ні (fi та
fi
). Так само слова, що містять його: fi t mis fi ts (fit misfits
) вставляє як fi t mis fi ts (fit misfits
). Може, це залежить від того, чи розуміє місце, яке він вставляється, кодування, яке використовується?
Наскільки неправильно моє розуміння цього? Чи може хтось правильно мене сказати: виклавши чітке визначення різниці між гліфами та символами (якщо моя помиляється чи можна вдосконалити), і навести більш чіткі / точні приклади, ніж моє, що це означає на практиці ?