Shihad 04.05.2010 14:06

Есть вопрос!Djvu в линукс

Господа, какие программы посоветуете для сборки djvu из отдельных tiff'ов? Желательно с графическим интерфейсом, но можно и без оного.
И есть ли какие-нибудь распознавалки для русского, сохраняющие текст для djvu?


Тэги: djvu OCR вопрос обработка сканов
+ 3 -
Похожие Поделиться

m0nhawk 04.05.2010 14:17 #
Могу предложить pdf-shuffler, но он, очевидно, только в pdf.
dicson 04.05.2010 14:24 #
imn 04.05.2010 14:24 #
Gscan2pdf
умеет сохранять в djvu но в бубунте 10.04 эта функция у меня перестала работать поэтому сохраняю в pdf а потом конверчу в djvu

pdf2djvu -d 400 --lossy 1234.pdf -o 1231321.djvu
imn 04.05.2010 14:27 #
sudo add-apt-repository ppa:jeffreyratcliffe/ppa
для 10.04 пока там пусто... но может не у всех как у меня чуство ускоренного времени )))
imn 04.05.2010 14:29 #
блин... не дочитал вопрос... именно распозновать я не пробовал, просто картинки
Infy 04.05.2010 16:27 #
Программа 'gscan2pdf', возможно, подойдет вам.
Официальный сайт:
http://gscan2pdf.sourceforge.net/

Она является графической. Если точнее, то она является внешней надстройкой для консольных утилит. Она поддерживает распознавание текста через 'gocr', 'tesseract' и 'ocropus'. Возможно, что получится работать с русским языком.

Не могу не отметить, что просто для сборки tiff'ов в один файл djvu удобно использовать следующий скрипт (требует наличия djvulibre):

#!/bin/bash
DEFMASK="*.tiff"
DPI=600
OUTFILE="out.djvu"

MASK=$DEFMASK

for i in $MASK; do
if < ! -e $i >; then
usage
echo "Error: current directory must contain files with the mask $MASK"
echo
exit 1
fi

if < ! -e $i.djvu >; then
echo "$i"
cjb2 -dpi $DPI $i $i.djvu
fi
done

djvm -c $OUTFILE $MASK.djvu

for i in $MASK; do
if < -e $i.djvu >; then
rm -f $i.djvu
fi
done
Infy 04.05.2010 16:44 #
Данный написан скрипт для черно-белых(bitonal) изображений, что удобно для сборки после работы с scantailor.
Для цветных и "серых" нужно использовать другие кодеки.
Их описание можно найти на этой странице:
http://djvu.sourceforge.net/doc/index.html
Infy 04.05.2010 18:14 #
*Данный скрипт написан
galaxyman 05.05.2010 10:22 #
alff31 13.05.2011 18:34 #
minidjvu *.tif output.djvu
alff31 13.05.2011 18:35 #
Правда без распознавания, просто сборка.