RFC 3066 надає подробиці дозволених значень (наголоси та додані посилання):
Всі двобуквні підтеги інтерпретуються як ISO 3166 альфа-2 коду країн з [ISO 3166] , або згодом призначаються органом з технічного обслуговування ISO 3166 або керівними органами стандартизації, що позначає область, до якої відноситься цей мовний варіант.
Я трактую, що як будь-який дійсний (згідно ISO 3166) 2-буквений код є дійсним як підтег. RFC продовжує заявляти:
Теги з другими підтегами від 3 до 8 букв можуть бути зареєстровані в IANA відповідно до правил глави 5 цього документа.
До речі, це виглядає як помилка друку, оскільки глава 3, здається, стосується процесу реєстрації, а не глава 5.
Швидкий пошук реєстру IANA виявляє дуже довгий список усіх доступних мовних підтегів. Ось один приклад зі списку (який би використовувався як en-scouse
):
Тип: варіант
Підтег: scouse
Опис: Scouse
Додано: 18.09.2006
Префікс: en
Коментарі: англійський ліверпудський діалект, відомий як "Scouse"
Доступні всілякі підтеги; швидкий сувій вже виявив fr-1694acad
(французи 17 століття).
Корисність деяких із цих (я б сказав, переважна більшість з них) тегів, що стосується документів, призначених для відображення в браузері, обмежена. У специфікації W3C Internationalization просто зазначено:
Браузери та інші програми можуть використовувати інформацію про мову вмісту, щоб доставити користувачам найбільш відповідну інформацію або представити інформацію користувачам найбільш відповідним чином. Чим більше вмісту буде правильно позначено та позначено тегом, тим кориснішими та поширенішими будуть такі програми.
Я намагаюся знайти детальну інформацію про те, як ведуть себе браузери, коли вони стикаються з різними мовними тегами, але, швидше за все, вони запропонують певну користь тим користувачам, які використовують зчитувач екрана, який може використовувати тег для визначення мови / діалекту / наголосу в якій представити зміст.