Експорт: Скопіюйте текст з PDF без розривів рядків


12

У дикій природі є деякі PDF-файли, де кожен рядок тексту здається жорстким кодом, тому коли я копіюю текстовий блок, все йде з ним: Розриви рядків і навіть "-" роздільники.

Мої запитання: Як створити PDF-файли в InDesign, де такої поведінки не відбувається.

Хтось знає більше про це?


2
Я просто хотів би прокоментувати, що це велика проблема у багатьох академічних статтях, і я не знайшов жодної причини / рішення цієї проблеми. Сподіваючись на гарні відповіді!
benteh

... тож у цьому може бути винна функція експорту в якійсь ідіотичній практиці з епохи докембрії.
benteh

Відповіді:


3

Це тому, що PDF-файли можна генерувати багатьма способами з ряду програмного забезпечення та інтернет-додатків. Кожна з них обробляє рядки тексту по-різному, тому ви ніколи не можете сказати, як насправді текст укладений, поки ви не спробуєте скопіювати вставити його з PDF назад в InDesign.

Однак, експортовані PDF InDesign, як правило, зберігатимуть пробіли в кінці кожного рядка, тому вам не доведеться турбуватися про те, що після кожного рядка буде вставлено повернення абзацу. Щоб переконатися на 100%, поставте Create Tagged PDFпрапорець під час експорту PDF з InDesign. Особисто я завжди проверяю це поле і включатиму його до будь-яких пресетів, якими я користуюся. Детальніше про цю опцію тут .

Якщо ви стикаєтесь з неправильно експортованим PDF-файлом і вам потрібно очистити кінцеві абзаци, що повертаються після кожного рядка тексту, найшвидшим варіантом є Знайти / Замінити. Введіть ^pв Find whatполе і поставити пробіл в Change toполе. Виберіть Storyабо Selectionнижче, залежно від вашої ситуації, і це повинно очистити ваш текст.

знайти діалогове вікно зміни


2

Одним із способів роботи є експорт PDF у вигляді HTML з Acrobat Pro , відкрийте цей файл у своєму веб-браузері, а потім скопіюйте текст звідти.

На відміну від експорту у текстовому форматі, HTML зазвичай не порушує рядки.

Наскільки мені відомо, ви не можете запобігти цьому від InDesign. Це, мабуть, поведінка, що випливає з програмного забезпечення PDF або PDF. Можливо, що будь-яке програмне забезпечення для публікації, яке використовує "текстові кадри / поля", створить такі тексти у форматі PDF.


-2

Це тому, що саме так pdfs розпізнає текст - кожен рядок насправді стає абзацом (звідси повернення в кінці його). Не обійтися навпаки, вам доведеться глобально змінити їх у документах, після копіювання, використовуючи параметр Знайти / замінити та приховані символи.


1
Але є PDF-файли, які не мають такої поведінки. PDF, де ви можете скопіювати всю справу без зайвих клопотів. Мені просто цікаво, як цього можна досягти під час експорту.
КСПР
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.