Перетворення між UTF-8 та 1255 в Інтернеті та локально?


2

У мене є цей HTML-файл

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<HTML DIR="RTL" LANG="HE">
<HEAD>
<META http-equiv="Content-Type" content="text/html; charset=Windows-1255">
</HEAD>
<BODY>
  <H1>úåøä</H1>
<H1>úåøä ðáéàéí åëúåáéí</H1>
</BODY>
</HTML>

Він зберігається як ANSI у блокноті. І при відкритті в браузері він відображає певні івритні символи.

Зауважте, Chrome так само добре може працювати з UTF-8, і він також може бути скопійований у Ms Word 2010.

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<HTML DIR="RTL" LANG="HE">
<HEAD>
<meta http-equiv="content-type" content="text/html;charset=UTF-8">
</HEAD>
<BODY>
<H1>תורה נביאים וכתובים</H1>
</BODY>
</HTML>

Але наступне обговорення передбачає копіювання / вставлення з Windows-1255.

Скопіюйте у буфер обміну в Chrome
введіть тут опис зображення

Вставка у слово ms 2010
зберегти форматування джерела рис

Я можу використовувати свій веб-браузер для перетворення цього Windows-1255 в unicode (наприклад, як UTF-8).

Наприклад, з цим HTML. Chrome конвертує

úåøä --->
תורה úåøä ðáéàéí åëúåáéí -> תורה נביאים וכתובים

Але як я можу конвертувати іншим способом?

Наприклад, припустимо, у мене є файл, який я записую в блокнот

Це має

תורה  
תורה נביאים וכתובים

Я можу зберегти його як UTF-8 або зовсім не. Я міг би залишити його у файлі без назви.

Як перетворити його в

úåøä   
úåøä ðáéàéí åëúåáéí  

Якщо я знаходжу веб-сторінку з івритом, написаною на ній, і переглядаю джерело в хромі, я бачу її на івриті, і я зберігаю її, і вона з'являється в Windows-1255. Як це відбувається з http://www.mechon-mamre.org/i/t/t0.htm Це тому, що сам файл зберігається у Windows-1255. І якщо його зберегти та відкрити в блокноті, це бачимо.

Якщо я скопіював єврейські символи у файл і зберег його як utf-8, він відображатиметься в Chrome, але я не бачу, як перетворити його в Windows-1255.

Я не бачу, як навіть дістати блокнот, щоб зберегти іврит символів як Windows-1255

Відповіді:


0

Для Інтернету я не знаю. Я знаю лише латинь-> іврит, створивши HTML-сторінку!

На локальному рівні у хорошому текстовому редакторі можна пройти обома способами.

Для локальних даних дамп-блокнот для цього завдання, оскільки він підтримує символи UTF-8 та unicode, включаючи іврит, він не кодується в Windows-1255 (іврит), тому коли ви намагаєтесь зберегти unicode як "ascii", він не використовує windows 1255 (іврит). лише 1252 або iso 8859-1, і це не зробить це належним чином, оскільки єврейських символів не існує у 1252 році.

Кумедні символи - латинські символи, ви бачите, це 1255 (іврит) неправильно прочитано як 1252 - ви можете це зробити, але ви не можете зберегти іврит, оскільки 1252 'блокнот не знає або не обчислює, які латинські символи використовувати. Це просто говорить, що ви втратите кілька символів, і якщо ви спробуєте зберегти їх, це не станеться, і коли ви прочитаєте їх після того, як вони не збереглися правильно, ви отримаєте знаки питання або квадрати. Тому забудьте блокнот для збереження івритних символів

Використовуйте текстовий редактор, що підтримує Windows-1255 (іврит ascii). Він працює в програмі editpad pro (не безкоштовно). Але блокнот ++ або babelpad, ймовірно, роблять це так само легко (хоча жодна з цих програм на даний момент не є такою хорошою для вставки з них у ms word. Epp ви копіюєте іврит, це вставляє латинські символи, блокнот ++ і babelpad ви вставляєте в слово і не " t отримаєте опцію "зберігати форматування джерела"), але ви можете помістити іврит на сторінку html (наприклад, utf-8 у запитанні), а потім скопіювати її з chrome у слово ms.

відкрийте програму редагування, натисніть кнопку перетворити .. кодування тексту .. Windows 1255

скопіюйте / вставте єврейські символи з блокнота в програму editpad pro.

збережіть файл.

І можна піти обома шляхами.

úåøä ---- перетворити на Windows 1255 (також слід відкрити як 1255) отримати іврит. І перетворити назад до 1252 (також має відкритись як 1252) (західноєвропейський)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.