Питання наголошеного персонажа


0

У мене є безліч веб-сайтів, закодованих у UTF-8. Вони містять акценти та ті дивні образи, що з ними хитаються, і всілякі забавні речі.

Коли я намагаюся відкрити їх у будь-якому текстовому редакторі, навіть у Блокноті ++ із кодуванням символів, встановленим на UTF-8, я отримую деякі дивні символи.

У моєму браузері:

введіть тут опис зображення

У текстовому редакторі:

введіть тут опис зображення

Невже хтось може пояснити, що тут відбувається?

Відповіді:


1

HTML використовує наступні об'єкти для букв та інших символів, які використовуються в іноземних мовах. Поглянь, і ти побачиш, що цей "ó"персонаж є "ó".

І це хороша стаття про UTF-8 і символів кодування в браузерах:

На початку був ASCII, і все було просто. Але вони були недобрі, бо ніхто не міг писати кирилицею чи тайською мовою. Таким чином, вибухнуло поширення кодування символів, щоб усунути проблему, розширивши символи, які ASCII може виразити. Ця смішно спрощена версія історії кодування символів свідчить про те, що зараз існує безліч кодувань символів.

Кодування символів повідомляє комп'ютеру, як інтерпретувати необроблені нулі та нулі в реальні символи. Зазвичай це робиться шляхом сполучення чисел із символами.


1

Сторінка написана з використанням посилань на сутність (старий термін) або з назвою посилань на символи (термін HTML5), які є спеціальними позначеннями для символів. На кодованій UTF-8 сторінці ви можете використовувати, наприклад, "ó" як таку, але посилання на зразок також óє дійсним, і автори / розробники сторінок можуть віддавати перевагу з різних причин (наприклад, не знаючи, як ввести "ó" ). Досить часто використання об'єктів - це лише ухилення від старих практик, які колись були необхідними (у 1990-х роках) до широкої підтримки UTF-8 у браузерах.

Позначення óє повністю безпечним для використання, хоча робить вихідний код HTML менш читабельним. Наприклад, якщо користувач копіює та вставляє текст, він отримує "ó", тому що óіснує лише в джерелі HTML; він внутрішньо перетворюється на "ó" за допомогою HTML-аналізатора браузера.

Однак деякі посилання небезпечні. Як правило, сутності, визначені в HTML 4.01, є безпечними. (Деякі з них можуть посилатися на символи, які не завжди відображаються правильно через проблеми з шрифтом, але такі проблеми існують зовсім незалежно від використання об'єкта порівняно з самим символом.) У HTML5 існує набагато більший набір іменованих посилань на символи , а старі версії браузера часто не підтримують розширення.

Наприклад, ōможе підтримуватися або не підтримуватися. Якщо він підтримується, він відображається як "ō" (o з макроном); якщо він не підтримується (наприклад, в IE 9 і новіших версіях), він відображається буквально. Тому набагато безпечніше використовувати сам символ або числовий референс ō.


1

Коли я намагаюся відкрити їх у будь-якому текстовому редакторі, у мене з’являються деякі дивні символи

importación

Вони є спеціальними кодами HTML .

ó є особливим представленням символів для "нижнього регістру" з "гострим акцентом".

Ви можете побачити повний список кодів HTML Спеціальний Entity в HTML Таблиця кодів .


Елементи HTML та / або коди ISO Latin-1 можуть бути розміщені у вихідному коді, як і будь-які інші буквено-цифрові символи, щоб створити спеціальні символи та символи, які неможливо генерувати в HTML за допомогою звичайних команд клавіатури.

Наприклад, для надання Дюссельдорфу джерело HTML має прочитати

Düsseldorf or Düsseldorf

Джерело HTML: Спеціальні символи


Дуже дякую за це пояснення. Дуже корисний. Так що тут немає помилок, і це правильно відобразиться в моєму HTML, я просто дурний. Дякую :)
Simon Kiely
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.