Программа для внедрения текстового OCR слоя в DJVU книги. Текстовый слой позволяет использовать поиск по документу и копировать текст из DJVU в DOC (word) или TXT.
DJVU OCR работает совместно с программой FineReader 7/8/9 версий, предназначенной для распознавания текста. Оцифровка происходит в три этапа:
DJVU OCR конвертирует документ в формат TIFF
FineReader распознает текст в полученных изображениях
DJVU OCR обрабатывает рабочий проект Finereader, извлекает необходимую информацию и интегрирует текстовый слой в DJVU.
Кроме интеграции программа может извлекать уже существующий текстовый слой в DJVU файла (режим Извлечь OCR Слой). Можно указать диапазон страниц для извлечения текста или обработать весь документ. Выходной формат: TXT, HTML.
Программа не требует установки. В архиве 4 исполняемых файла:
DjvuOCR Win32 GUI версия.
FRFGrab консольная версия.
Djvused стандартная утилита пакета djvulibre.
cvthtml2 конвертация OCR слоя в HTML (UTF8).
Продвинутые пользователи могут использовать консольную версию программы (подробное описание команд есть в файле справки), остальным же достаточно запустить DjvuOCR.exe, который имеет привычный интерфейс.