Зміна формату слова


0

Я переглядаю деякі файли Word, востаннє відредаговані колишнім помічником. Якщо вимкнено "показ усіх символів, що не друкуються", це виглядає окрім інших дивних змін шрифту. Якщо ввімкнути "показ усіх символів, що не надруковуються", відображається форматування, яке робить його правильним, але це явно не форматування, яке вводиться людиною. Приклад - оригінальний документ мав нумерацію рядків кожні п’ять рядків. Ця версія здається, що вона має нумерацію рядків, але вони є лише символами. Він має перерву розділу перед кожним 5-м рядком. Щоб зробити скромну редакцію, я експортую все це як текст і починаю над введенням форматування. Будь-яка ідея, як це могло статися? Можливо, це з’явилося через OCRing PDF? Якийсь магічний спосіб її виправити?

Відповіді:


1

Так, таке форматування звучить як те, що може статися, коли ваше програмне забезпечення для OCR налаштовано для інтерпретації сканованого, коли насправді вам просто потрібен звичайний текст для застосування стилів.

Давно в системі Windows нам довелося відновити електронний документ з єдиної, що залишилася друкованої копії. Програмне забезпечення мала функцію розмітки, де воно:

  1. Скануйте сторінку та покажіть попередній перегляд
  2. Дозволяють намалювати прямокутні рамки над цікавими частинами (це був зручний інструмент для ігнорування фрагментів сканування)
  3. Створіть текстові поля, які містять відсканований текст
  4. Надайте кнопку, яка скопіювала б текст у буфер обміну

Справа в копіюванні в буфер обміну, якщо ви натиснули кнопку, то відбулося деяке тлумачення, яке запровадило прохідне форматування, але у вас більше не було простого тексту.

Однак на кроці (3), якщо ви перетягнути вибраний текст у полі абзацу і вручну скопіювати у буфер обміну, ви отримаєте звичайний текст, якому було простіше призначити стилі.

Що стосується програмного забезпечення Mac, спробуйте демонстрацію найновішого Adobe Acrobat і перевірте, чи може він зробити гідну роботу, виконуючи OCR на скріншоті / скануванні цих файлів Word.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.