Як можна покращити сірий текст на сканованих скам’ячених квитанціях?


2

Розглянемо наступний фрагмент сканованої квитанції:

введіть тут опис зображення

Зазвичай під час сканування квитанцій мені вдається розділити текст і фон, використовуючи щось на зразок інструменту вибору кольорової гами, розширення вибору, перо, а потім перевернення виділення та фарбування фону в білий. Тоді я можу пограти з рівнями зображення, не переживаючи надмірно підкреслити фон. Я все це роблю з Gimp (і Photoshop робить такі речі теж).

Але коли моє відскановане зображення зім’яте, його сканування має підсвічування та тіні, які, як правило, плутають вибір на основі кольорів та цінностей. І все-таки форми письма виділяються достатньо, щоб зробити чіткі відмінності.

Моє запитання: Що я можу зробити, щоб підкреслити сірий текст у таких зображеннях, не підкреслюючи також крихти / тіні на сторінці?

Примітки:

  • Колір є зворотною стороною квитанції, а не водяним знаком, але він також міг бути водяним знаком.
  • Це, мабуть, термопапір , але питання актуальне і для нетермічного паперу.
  • Мені нічого не потрібно OCR.
  • Мені важливо не втрачати шматочки букв, навіть ціною, що залишилося кілька нетекстових артефактів.
  • Цей текст єврейською, але це не має значення.
  • Приклад уже після невеликої гри з рівнями.

Ви намагалися згладити перед скануванням (можливо, праскою)?
DavidPostill

1
@DavidPostill: З праскою? Він згорить ... але: 1. Так, у мене є. Я гадаю, що я міг би надати більше ваги поверх сканера. 2. Для цілей цього питання припустимо, що зображення є таким, яким воно є.
einpoklum

2
Можливо, що це термопапір. Якщо так, прасування було б якось контрпродуктивним.
fixer1234

Відповіді:


2

Ваша техніка звучить так, що ви на правильному шляху, але вам може знадобитися виділити ділянки з кольоровими і відтінковими відмінностями і по-різному ставитися до них. Це багато роботи. Я спробував це, не йдучи цим маршрутом, і навіть з гучним фоном він не вийшов занадто поганим.

Колір часто є ключем до очищення. Подивіться на окремі кольорові канали в різних кольорових просторах. Знайдіть ті, які найбільше контрастують між друком та фоном, і використовуйте гаму, кольорові криві або контраст, щоб поліпшити їх там. Ви можете тонко налаштувати криву, щоб створити найбільш розтягнення в діапазоні, де потрібно посилити дискримінацію. Насправді будь-який інструмент або комбінації інструментів, які можна використовувати для поліпшення дискримінації між друком та фоном, допоможуть, якщо ви працюєте з ізольованими областями. Ви можете часто вдосконалити її за допомогою послідовних пропусків та чергування кольорових просторів.

Якщо певні кольорові канали мають дуже низьку контрастність, вони можуть створювати шум. Якщо ви не можете розірвати друк та фон за допомогою кольорових кривих, ви можете покращити його, зменшивши або усунувши канал.

Коригування кольорових кривих таким чином призведе до дивного забарвлення. Перетворіть результат у масштаб сірого або використовуйте канал освітлення. Звідти використовуйте аналогічний інструмент кривої кольорів для оптимізації контрасту.

Можливо, вам доведеться скористатися інструментом гумки або вибрати область фону та видалити, щоб вручну видалити шум, який дуже нагадує друк.

Якщо вам потрібно бути агресивним для усунення важкого фону, як, наприклад, у зразковому зображенні, ви можете закінчити чисту друк, але прогалини, де частини символів були занадто схожі на фон. Використовуйте інструмент вибору за кольором і встановіть величину допуску дуже високою (широка кольорова діапазон; в цей момент слід друкувати все, що має кольори, віддалені від друку). Виберіть друк. Використовуйте інструмент для оперення, щоб наростити межу на кілька пікселів, що додасть багато прогалин.

Використовуйте це як маску на оригіналі, щоб дістати друк. Потім ви можете змішати обидві версії (я зазвичай використовую яскравість), що поєднає в собі переваги кожної.

Але почніть з найчистішого зображення, яке ви зможете отримати, позбувшись від якомога більшої кількості зморшок. Якщо ви збираєтеся спробувати прасувати квитанцію, спершу спробуйте її в районі, віддаленому від друку. Якщо це термопапір, ви перетворите її темною. До речі, стрічка або плівка холодного ламінування також потемніє термопапір. Навіть деякі види нетермічного паперу можуть потемніти від тепла.

Я не робив ніяких прибирань в межах окремих персонажів. Я просто використовував кольорові канали та криві, а потім нарізав кілька великих темних плям на темному тлі. Потім я зробив маску з результату, використав її для витягування друку з оригіналу та змішав обидві версії, які створили це:

введіть тут опис зображення

Якщо у вас є частини символів, які тісно відповідають фону (світлий друк на тлі подібного кольору і темряви), немає практичного способу видалити фон, не взявши з собою частину світлого друку (саме тут виділяють різні ділянки дозволяє чітко налаштувати очищення таким чином, що ви не можете виконати обробку всього зображення однаково). Однак майте на увазі, що ви також будете боротися з оптичною ілюзією.

Коли на тлі подібного відтінку є друковані символи, і особливо якщо ви знайомі з персонажами, ваш мозок заповнить недосконалості. Якщо ви збільшуєте своє зображення, ви побачите невеликі прогалини в символах, кольором фону, що відображається. Прогалини стануть набагато очевиднішими, коли ви дивитесь на окремі кольорові канали.

введіть тут опис зображення введіть тут опис зображення

Дивлячись на оригінал на нормальній відстані перегляду, символи здаються більш завершеними, ніж вони є насправді. Якщо ви робите гарну роботу з видалення всього фону, тож у вас є те, що схоже на чорний друк на білому папері, недосконалість символів буде набагато помітнішою.

введіть тут опис зображення введіть тут опис зображення

Якщо потрібно, ви можете "ретушувати" результат, вручну заповнивши очевидні прогалини на збільшенному зображенні.


1

Глобальне регулювання контрасту (використовуючи IrfanView , нижче) створило зображення, яке мені здавалося чіткішим. Хоча це може не відповідати вашим потребам у цих налаштуваннях, ви можете налаштувати контраст і переглянути зміни в режимі реального часу. Крім того, усунення червоних та зелених каналів може позбутися від синіх складок. До речі, IrfanView добре працює під вином, як і в Windows, хоча це не настільки потужний редактор зображень, як GIMP.

Коригування IrfanView

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.