FineReader: распознавание из контекстного меню или через командную строку
Abbyy FineReader PDF 15 - штука мощная, текст на документах распознаёт качественно и странички выравнивает. Но интерфейс тяжёлый и неповоротливый, запускается долго, десять раз подумаешь, а стоит ли его открывать ради одной pdf-ки. Из средств автоматизации - только "горячая папка", которая требует постоянно работающей службы.
К счастью, модуль распознавания вынесен в отдельный exe-шник, и параметры его запуска секрета не представляют. Мне показалось удобным добавить FineReader в меню "Отправить...", теперь я могу отправить документ или сразу пачку документов на распознавание в фоне одним кликом.
Если хотите также, зайдите в папку Отправить..., набрав в проводнике волшебное слово sendto
, или полный адрес C:\Users\ваш пользователь\AppData\Roaming\Microsoft\Windows\SendTo
.
Создайте там файл с расширением bat и следующим содержимым:
:loop
@echo off
set "filename=%~n1"
set "extension=%~x1"
set "output=%1.pdf"
if /i %extension% == .pdf set output=%1
echo Распознаём %extension% документ [%filename%]
start /wait "" "C:\Program Files (x86)\ABBYY FineReader 15\FineCmd.exe" %1 /lang russian english /out %output% /quit
shift
if not "%~1"=="" goto loop
Можно скачать уже готовый, чтобы не мучиться с кодировкой (которая должна быть OEM 866).
Принимаются любые пригодные для распознавания документы, включая конечно PDF и картинки со сканера в JPG, TIF и т. д. В случае с PDF распознанная версия сохраняется под тем же именем, заменяя исходник, чтобы не оставлять ненужный мусор. Для остальных типов файлов создаётся новая pdf-ка рядом. Если терять исходник вы не хотите, удалите строчку if /i %extension% == .pdf set output=%1
чтобы всегда создавался новый документ.
Документы обрабатываются последовательно, поскольку распознавалка полностью использует все ядра процессора, и больше одного экземпляра приложения за раз запускать смысла нет.
-
В параметрах запуска указаны русский и английский языки. Добавьте другие, если нужно.
-
Путь к исполняемому файлу у вас может слегка отличаться, не забудьте поправить!
Получившийся распознанный PDF после того, как с ним поколдовал FireReader, как правило занимает в два-три, а то и в десять раз меньше места, чем неоптимизированный оригинал.
Смотрите также: Отправить... в уничтожитель!