Чи може Acrobat 11 зробити OCR за допомогою декількох ядер процесора?


8

Обробка OCR вимагає часу. Використання декількох ядер процесора пришвидшило б обробку. Acrobat 10 не був багатопоточним додатком . Як щодо Acrobat 11? Чи 11 за замовчуванням робить OCR, використовуючи кілька ядер CPU (якщо вони доступні)? Якщо ні, чи існують якісь обхідні шляхи, наприклад, сценарії, щоб зробити Acrobat 11 зробити OCR за допомогою декількох ядер процесора? Або через вбудовану мову скриптів Acrobat, або за допомогою зовнішніх скриптів, які запускають та направляють кілька екземплярів одного потоку Acrobat паралельно до частин завдання обробки.

Примітка. Це питання не надто локалізовано (не обмежується певним моментом часу), оскільки (1) Adobe не випускає нові основні версії Acrobat дуже часто (Acrobat 10 було випущено два роки тому) та (2) Adobe Acrobat - широко використовуване додаток.

Відповіді:


6

Я встановив пробу Acrobat 11 (XI) у VirtualBox. Acrobat 11 - це одиночна різьба.

Я також створив зовнішній скрипт, який запускає кілька екземплярів Acrobat (по одному на ядро ​​CPU), паралельно обробляє завдання OCR і об'єднує результат. Важливим кроком є ​​ввімкнути вхід помилок у налаштуваннях Acrobat, проаналізувати всі .log та переробити будь-які файли помилок. Сценарій (при використанні 4 ядер) все ще робить OCR в два рази швидше, ніж за замовчуванням Acrobat 11.


4
Ви можете просто дати джерело, якщо хочете. Якщо вони наважуються її зняти, її можна буде легко відновити.
Джої

Крім того, якщо у вас є та сама особа, яка розмістила запитання, подумайте про об’єднання обох поточних незареєстрованих облікових записів з новим зареєстрованим. Ви можете почати тут , а також прочитати це для отримання додаткової інформації. Після цього ви зможете внести зміни до свого питання, як вважаєте за потрібне.
Індрек

Я нічого не намагаюся перешкоджати. Оскільки ви постійно перемикаєте імена користувачів, виявилося, що ваші зміни були внесені третьою стороною, яка, схоже, не розуміла оригінального питання. Крім того, якщо ви хочете відповісти на власне запитання, вам слід написати запитання і відповісти всім відразу.
Ісаак Рабінович

Зараз я об'єднав ваші (незареєстровані) акаунти. Однак ми б просили вас не використовувати одноразову адресу електронної пошти, а зареєструватись на нашому сайті, щоб ви могли залишатися ввійти в систему, коментувати свої питання тощо. Також нічого не знімуть, нічого хвилюватися. Зауважте лише, що анонімні зміни завжди переглядаються більш суворо.
slhck

1
@tarcman Будь-яка можливість розміщення вашого сценарію? Я впевнений, що є дуже багато людей, які були б зацікавлені ним користуватися
Джейсон

1

Багатопотокове читання потрібно вбудувати в додаток. Розробник повинен записати код, який створює потоки, і який розбиває завдання на підзадачі, які можна виділити кожному потоку. Якщо розробники Acrobat не виконають цього для коду розпізнавання OCR, користувач не зможе створити додаткову логіку, необхідну.


2
Якщо це можна застосувати до діапазонів сторінок, ви, можливо, можете спробувати розділити роботу на кілька процесів, кожен OCRing лише кілька сторінок, а потім об'єднання результатів разом.
Joey

0

Щоб використовувати всі ядра для OCR, ви можете подивитися PDF-Exchange Editor. Можливо, OCR-двигун використовує всі ядра моєї системи. Як тільки ви досягнете цього рівня продуктивності, має сенс використовувати SSD.

Повинно бути налаштовано вікно, що призведе до того, що він приділяє більше часу процесору одному потоковому додатку, який не пов'язаний введенням / виводом. У моїй системі Acrobat не сповільнюється продуктивністю диска, але найбільше час роботи процесора, який я будую, складає близько 30%.

Подивимося, Acrobat - це широко використовуваний, але погано написаний додаток. У Acrobat Pro є деякі функції, які ви все ще не можете отримати більше ніде.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.