Підсумок
Якщо ваш сервер виписує сторінки з лігатурами (як це роблять смартфони), пошукові системи несумісні. Bing в даний час не індексує лігатури правильно. Я б сказав, загалом, це просить неприємностей. Оскільки пошукові системи змінюються, нижче є метод, який можна використовувати для перевірки того, наскільки пошукові системи вас цікавлять лігатурами індексів .
Якщо ваш сервер заповнює сторінки звичайним текстом, то Javascript перетворює їх у лігатури, це добре . Пошукові системи не застосовують зміни вмісту Javascript перед індексуванням сторінок (хоча стверджується, що є кілька винятків, як завантаження коментарів у Facebook ). Оскільки існує стандартний галузевий метод надання динамічного контенту пошуковим системам і цей метод схвалюється Google , було б великим сюрпризом, якщо це зміниться в майбутньому. Google радить переглядати ваш сайт за допомогою звичайного текстового браузера (наприклад, вони пропонують Lynx ), щоб побачити ваш вміст, як його бачить пошукова система.
Детальніше про перший випадок (сторінки, залиті лігатурами в коді) ...
В теорії
... це не повинно впливати на добре налаштовану пошукову систему.
Спочатку це допомагає зрозуміти різницю між гліфами та символами . Лігатура fi
- це один гліф, який означає два символи f
i
. Те, як програмне забезпечення ставиться до цього програмного забезпечення, залежить від контексту та завдання, яке ви бачите - із прикладів цього пов’язаного питання ви побачите, що коли ви копіюєте та вставляєте гліфи, те, що вставляється, змінюватиметься: іноді гліф вставляється, іноді гліф трактується як пов'язані з ним персонажами і f
і i
приклеюється.
Будь-який добре зроблений автоматичний текстовий процесор, який цікавиться семантикою тексту (пошукові системи, перевірка орфографії, зчитувачі екрану ...), повинен ставитися до гліфів як до ідентичних символів, для яких він стоїть, і повинен ставитися finally
як до ідентичних finally
, тому що це текстовий значення fi
гліфа.
На практиці
Не все добре зроблено ...
Ось простий спосіб перевірити пошукові системи. Ось рядок тексту з цього іншого питання:
Copy the ligature fi from Illustrator to this input box
Якщо ми беремо нелігатурну версію цього речення і шукаємо в ньому подвійні лапки:
(пошук далі "Copy the ligature fi from Illustrator to this input box"
):
- ... якщо пошукова система розглядає лігатурні гліфи як збіги для символів, які вони представляють, вона знайде цю сторінку (і, коли вона індексується, ця)
- ... якщо пошукова система розглядає лігатурні ліфти як різні символи, які вони представляють, вона не знайде нічого, поки ця сторінка не буде індексована, то вона знайде лише цю сторінку, і пошуки з версією лігатури знайдуть цю сторінку.
- ... якщо пошукова система вибухне при появі гліфів, таких як лігатури повністю, вона нічого не знайде, навіть ця сторінка, і пошуки з версією лігатури також не знайдуть нічого
Деякі швидкі результати для перших 5 світових пошукових систем (посилання на результати пошуку):
- Google: Хороший (тип 1) . (незважаючи на коментар нижче, він прекрасно справляється з форматуванням унікоду чи HTML-сутності)
- Bing: Fail ( тип 2 ).
- Yahoo: Fail ( тип 2 ) (виявляється, Yahoo "працює на Bing")
- Яндекс (рос.): Хороший (тип 1)
- Baidu (китайська): ерм, жодна сторінка graphicdesign.stackexchange.com, схоже, взагалі не відображається у пошуках Baidu ... можливо, нас там заборонено ...?!