Я працюю над веб-сайтом, який буде пропонувати локалізований контент відповідно до language+region
підходу, описаного на цій сторінці W3.org (наприклад, fr-CA
для вмісту канадської французької та fr-FR
для вмісту "французької французької мови"). Оскільки ми вважаємо вміст для кожного language+region
унікальним, для нас важливо, щоб пошукові системи відповідно ідентифікували та обслуговували вміст.
Здійснивши пошук в Інтернеті (наприклад, це питання ), здається, що більшість людей рекомендують використовувати код мови ISO639 в lang
атрибуті HTML для опису мови вмісту. Виконуючи цю рекомендацію, ми б зайнялися використанням, <html lang="fr">
яка не дозволила б розмежувати вищезгадані language+region
комбінації.
Переглядаючи специфікацію HTML4 , здається, що використання language+region
як мовного коду було б цілком нормальним, оскільки en-US
приклад наведено як одне можливе значення. Однак я не зміг знайти жодного підтвердження цього в специфікації HTML5, яка, здається, не надає жодного прикладу щодо можливих дозволених значень.
Звідти я спробував отримати фактичну відповідь, переглянувши, що роблять веб-гіганти. Я подивився на те, що робить Facebook: вони пропонують французьку та французьку французькі версії своїх веб-сайтів з (трохи) різним змістом, в той час як lang
значення HTML залишається тим самим:
fr-CA
URL: http://fr-ca.facebook.com
Атрибут HTML lang: <html lang="fr">
переклад слова 'email':courriel
fr-FR
URL: http://fr-fr.facebook.com/
Атрибут HTML lang: <html lang="fr">
переклад слова 'email':Adresse électronique
Який рекомендований / стандартний спосіб опису вмісту, локалізованого за допомогою language+region
підходу в HTML5?