Чи пропонували б Ви в 2010 році URL-адреси, що містять символи UTF-8, на великому веб-порталі?
Символи Unicode заборонені згідно з RFC у URL-адресах (див. Тут ). Вони повинні бути відсотково закодовані, щоб відповідати стандартам.
Моя головна думка, однак, полягає в обслуговуванні некодованих символів з єдиною метою мати красиві URL-адреси, тому відсоткове кодування вимкнено.
Здається, всі основні веб-переглядачі добре аналізують ці URL-адреси незалежно від того, що говорить RFC. Моє загальне враження, що воно стає дуже хитким при виході з домену веб-браузерів:
- URL-адреси, що отримують копію + вставлені у текстові файли, електронні листи, навіть веб-сайти з іншим кодуванням
- HTTP-бібліотеки клієнтів
- Екзотичні браузери, RSS-зчитувачі
Чи правильно моє враження, що тут слід очікувати неприємностей, і, отже, це не практичне рішення (поки), якщо ви обслуговуєте нетехнічну аудиторію, і важливо, щоб усі ваші посилання працювали належним чином, навіть якщо вони цитуються і передаються далі?
Чи є якийсь магічний спосіб подання приємних URL-адрес у HTML
http://www.example.com/düsseldorf?neighbourhood=Lörick
що можна скопіювати + вставити зі спеціальними символами неушкодженими, але правильно працювати при повторному використанні для старих клієнтів?