Я зберігаю рукопис, написаний моїм батьком. Файли даних розміщені на дискеті 5,25 ". Я успішно прочитав файли з дисків, але ніхто з нас не знає, який формат мови розмітки. Це один із видавців книг на початку 1990-х.
Ось кілька рядків з одного з файлів.
\m\m<ps;3><l>\
<ep>\
{cn}1 \
{ct}Rethinking Universality:<qa>\
Six Cases<lrh;;1>Rethinking Universality: Six
Cases<xlrh><rrh;;2>Rethinking Universality: Six Cases<xrrh> \
{t1}In 1983 the anthropological community was convulsed by reactions to
Derek Freeman\'s <ital>Margaret Mead and Samoa: The Making and Unmaking
of a Myth.<med> Remarkably, two books with a very similar message but
by different authors attacking different myths were published within a
year of Freeman\'s. One was Melford Spiro\'s <ital>Oedipus in the
Trobriands<med> (1982); the other was Ekkehart Malotki\'s <ital>Hopi
Time<med> (1983). Each of these books refutes or questions one of the
centerpieces of anthropological relativism.\
%In <ital>Coming of Age in Samoa<med> (1928) Margaret Mead argued that
adolescence among Samoans was not the time of storm and stress that it
is in the West and, hence, that the Western conception of adolescence
is strictly cultural\Msomething that we could change. Freeman shows
that adolescence was just as stressful in Samoa as in the West and that
in other ways Samoa was not so different from Western societies as Mead
had led us to believe.\
Чи може хтось визначити мову розмітки, яку тут використовують?
У мене є і ці оригінальні файли, і видана книга. Мені було б не дуже складно зрозуміти, що означають коди. Але якщо формат вдасться ідентифікувати, може бути доступний якийсь автоматичний перекладач на щось більш сучасне (RTF, XML тощо).
Редагувати
Це як таємниця, яку треба розгадати! Ось як розпочинається таблиця:
<begtab;tbl2;1p><setnc;2><setctr;5p><tblwidth;15p><setbgut;rsidbox;0q>
Я зробив деякі погуглити навколо термінів , як begtab
і setbgut
. Останній виявив документ PDF, який, здається, має в ньому "друкарську помилку", але помилка друку - це setbgut
тег, майже такий, як у моїх файлів.
http://sfmb.ulb.ac.be/pdf/J_Biol_Chem_1999_274_22_15510.pdf (пошук setbgut
)
Здається, цей дослідницький документ був розроблений за допомогою того ж програмного забезпечення. Я ввів його в Acrobat, і властивості кажуть, що його створив Xyvision Parlance Publisher (XPP). Ось найкраще, що я знайшов про них поки що: http://www.isgmlug.org/n2-1/n2-1-49.htm
Редагуйте 2
Гаразд, зараз я бачу. XPP - мова розмітки, подібна до SGML. Насправді, література з продажу XPP рекламує, як "легко" взяти існуючий документ SGML та додати їх власні теги. На жаль, XPP був проданий General Dynamics кілька років тому. Автоматичний переклад документа в, скажімо, HTML складний без DTD. Однак, як зазначали інші, більшість тегів легко зрозуміти. Деякі з них, такі як бібліографічні посилання та значення після крапки з комою в тегах, таких як <rrh;1>
і <lp;&-1q>
досі, уникають мене. Мені доведеться порівняти файл із фізичною паперовою копією поруч, щоб розшифрувати все це.
lrh
і rrh
біжать голови відповідно ліворуч і праворуч. xlrh
і xrrh
вийти з режиму запущеної головки. cn
центрує число, де-як ct
центрирує заголовок. ital
переводить вас у курсивний режим, а med
повертає вас у середній режим. %
починає новий абзац, де зворотна косою рисою просто продовжує абзац. Я не можу розібратися з іншими, і зробив досить багато пошукових термінів, але жоден не розкриває формат ...