У мене є цей HTML-файл
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<HTML DIR="RTL" LANG="HE">
<HEAD>
<META http-equiv="Content-Type" content="text/html; charset=Windows-1255">
</HEAD>
<BODY>
<H1>úåøä</H1>
<H1>úåøä ðáéàéí åëúåáéí</H1>
</BODY>
</HTML>
Він зберігається як ANSI у блокноті. І при відкритті в браузері він відображає певні івритні символи.
Зауважте, Chrome так само добре може працювати з UTF-8, і він також може бути скопійований у Ms Word 2010.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<HTML DIR="RTL" LANG="HE">
<HEAD>
<meta http-equiv="content-type" content="text/html;charset=UTF-8">
</HEAD>
<BODY>
<H1>תורה נביאים וכתובים</H1>
</BODY>
</HTML>
Але наступне обговорення передбачає копіювання / вставлення з Windows-1255.
Скопіюйте у буфер обміну в Chrome
Вставка у слово ms 2010
Я можу використовувати свій веб-браузер для перетворення цього Windows-1255 в unicode (наприклад, як UTF-8).
Наприклад, з цим HTML. Chrome конвертує
úåøä --->
תורה úåøä ðáéàéí åëúåáéí -> תורה נביאים וכתובים
Але як я можу конвертувати іншим способом?
Наприклад, припустимо, у мене є файл, який я записую в блокнот
Це має
תורה
תורה נביאים וכתובים
Я можу зберегти його як UTF-8 або зовсім не. Я міг би залишити його у файлі без назви.
Як перетворити його в
úåøä
úåøä ðáéàéí åëúåáéí
Якщо я знаходжу веб-сторінку з івритом, написаною на ній, і переглядаю джерело в хромі, я бачу її на івриті, і я зберігаю її, і вона з'являється в Windows-1255. Як це відбувається з http://www.mechon-mamre.org/i/t/t0.htm Це тому, що сам файл зберігається у Windows-1255. І якщо його зберегти та відкрити в блокноті, це бачимо.
Якщо я скопіював єврейські символи у файл і зберег його як utf-8, він відображатиметься в Chrome, але я не бачу, як перетворити його в Windows-1255.
Я не бачу, як навіть дістати блокнот, щоб зберегти іврит символів як Windows-1255