На сторінках, намагаючись виділити все, що знаходиться всередині {фігурних дужок}


1

У мене є вихідний документ, який я намагаюся очистити, це по суті звичайний текст. Але автор виділено напівжирним шрифтом {} та курсивом, позначеним & lt; & gt; дужки.

Я хотів би мати можливість автоматично перетворювати їх у відповідний стиль. Чи є спосіб досягти цього? Це майже 200 сторінок, а на деяких - 30 примірників на одній сторінці. Це будуть тижня роботи зі швидкістю, яку я збираюся.

Я отримав найновіші сторінки (і жодної старішої версії). Чи є спосіб зробити це?


Чи потрібно використовувати Сторінки? Це може бути простіше зробити як RTF або щось інше, після чого скопіюйте та вставте його в Pages.
JMY1000

@ JMY1000 Я не бачу жодного робочого процесу, який дозволив би це бути розумною роботою. Який редактор RTF це зробить, щоб я міг вставити його назад? Окрім того, для того, щоб курсив працював, мені теж потрібно збільшити відстань між символами.
John O

Робота з менш влаштованим форматом означає, що можна написати сценарій, який робить це за вас. Ви універсально або лише на певних ділянках натикаєте на відстань між символами?
JMY1000

Крім того, чи існують області, які є напівжирними або курсивними чи ні? І чому ви це робите? Можливо, це буде простіше.
JMY1000

@ JMY1000 Не існує інших форматів, окрім напівжирного або курсивного, ніколи не обидва. Інше форматування має виконуватися вручну, але воно перевищує його, змінюючи стилі заголовків розділів і відступаючи (але не всі) абзаци. Цей матеріал я міг би пройти через годину-другу. Що стосується того, чому, я втомився дивитися на потворний звичайний текст у кур'єрі. Вирішили спробувати повторити це.
John O

Відповіді:


1

Я б рекомендував просто редагувати файл у файлі .rtf, оскільки він містить підтримку напівжирного та курсиву, але не настільки складний, як файли сторінок.

RTF використовує систему на основі тегів, що позначає певні властивості з зворотною косою рискою "" як керуюче слово, яке є чимось чистим для людини. . Погляньте на ці два фрагменти: один - форматований .rtf, а другий - відкритий текст (або код).

Це є a тест.

{\rtf1\ansi\ansicpg1252\cocoartf1404\cocoasubrtf470
{\fonttbl\f0\fswiss\fcharset0 Helvetica;}
{\colortbl;\red255\green255\blue255;}
\margl1440\margr1440\vieww10600\viewh10400\viewkind0
\pard\tx720\tx1440\tx2160\tx2880\tx3600\tx4320\tx5040\tx5760\tx6480\tx7200\tx7920\tx8640\pardirnatural\partightenfactor0

\f0\fs24 \cf0 This 
\b is
\b0  
\i a
\i0  test.}

Видаляючи метадані, ми все ще маємо дійсний файл .rtf, лише з меншим форматуванням (яке нам не потрібно.)

{This 
\b is
\b0
\i a
\i0  test.}

Нам навіть не потрібні ці рядки.

{This \b is \b0 \i a \i0 test.}

При цьому стає досить тривіальним перетворення тексту: все, що нам потрібно, це знайти і замінити. Спочатку створіть .txt з усіма даними і відкрийте його у вашому улюбленому текстовому редакторі - навіть TextEdit зробить це. Просто знайдіть та замініть:

  • { с \b
  • } с \b0
  • < с \i
  • > с \i0

Зверніть увагу на пробіл (можливо, потрібно буде відкрити код відмітки, щоб його побачити.)

Все, що нам потрібно зробити зараз, це додати фігурну дужку на початку і в кінці, і ми закінчили!

Lorem ipsum dolor sit amet, {consectetur adipiscing elit.} Donec placerat turpis in ligula ullamcorper, eget finibus ligula pretium. Etiam pellentesque {rutrum varius. Proin non} nunc quam. Pellentesque vestibulum quam enim, ac mollis metus venenatis eget. Vestibulum purus nulla, gravida quis erat ac, <luctus venenatis nunc. Pellentesque ac posuere dolor, sed tincidunt arcu.> Duis sodales magna justo, non porta turpis <aliquam eu. Etiam tempor, enim eget maximus tincidu{nt, orci justo} consequat erat, ac elementum justo enim ullamcorper ex. Nunc libero ex, efficitur eget neque commodo, tempus hendrerit ipsum. Ut id placerat> mauris, eu porta nulla. Donec ultrices lectus non elit condimentum sollicitudin. Mauris molestie felis eget hendrerit lobortis. Cras scelerisque et tellus nec ultricies. Nam nisi urna, vehicula eget posuere sed, interdum eu {sem.}

Lorem ipsum dolor sit amet, \b consectetur adipiscing elit. \b0 Donec placerat turpis in ligula ullamcorper, eget finibus ligula pretium. Etiam pellentesque \b rutrum varius. Proin non \b0 nunc quam. Pellentesque vestibulum quam enim, ac mollis metus venenatis eget. Vestibulum purus nulla, gravida quis erat ac, \i luctus venenatis nunc. Pellentesque ac posuere dolor, sed tincidunt arcu. \i0 Duis sodales magna justo, non porta turpis \i aliquam eu. Etiam tempor, enim eget maximus tincidu\b nt, orci justo \b0 consequat erat, ac elementum justo enim ullamcorper ex. Nunc libero ex, efficitur eget neque commodo, tempus hendrerit ipsum. Ut id placerat \i0 mauris, eu porta nulla. Donec ultrices lectus non elit condimentum sollicitudin. Mauris molestie felis eget hendrerit lobortis. Cras scelerisque et tellus nec ultricies. Nam nisi urna, vehicula eget posuere sed, interdum eu \b sem. \b0

Що слід зазначити: За промовчанням RTF не підтримує не-ASCII-символи. Якщо вам потрібно / хочете їх використовувати, вам потрібно буде ввести їх спеціально, використовуючи \u контроль.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.