Ще один варіант - ScanTailor . Ця програма особливо добре підходить для обробки декількох сканів одночасно.
apt-get install scantailor
На жаль, він працює лише на вводах файлів зображень, але досить просто перетворити відсканований PDF в jpg. Ось один вкладиш, який я використав для перетворення цілого каталогу PDF-файлів у jpgs. Якщо PDF має n сторінок, він створює n jpg-файлів.
for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;
У мене були готові ділитися скріншотами, але мені не вистачає представників, щоб розмістити їх.
ScanTailor виводить на тиф, тому якщо ви хочете, щоб файли були у форматі PDF, ви можете використовувати це для створення PDF для кожної сторінки.
for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;
Тоді ви можете скористатися цим одноразовим вкладишем або програмою на зразок PDFShuffler, щоб об'єднати будь-який або всі файли в один PDF.
gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf