Shihad 04.05.2010 14:06
Есть вопрос! — Djvu в линукс
Господа, какие программы посоветуете для сборки djvu из отдельных tiff'ов? Желательно с графическим интерфейсом, но можно и без оного.И есть ли какие-нибудь распознавалки для русского, сохраняющие текст для djvu?
m0nhawk 04.05.2010 14:17 #
+ 0 -
Могу предложить pdf-shuffler, но он, очевидно, только в pdf.
Gscan2pdf
умеет сохранять в djvu но в бубунте 10.04 эта функция у меня перестала работать поэтому сохраняю в pdf а потом конверчу в djvu
pdf2djvu -d 400 --lossy 1234.pdf -o 1231321.djvu
умеет сохранять в djvu но в бубунте 10.04 эта функция у меня перестала работать поэтому сохраняю в pdf а потом конверчу в djvu
pdf2djvu -d 400 --lossy 1234.pdf -o 1231321.djvu
sudo add-apt-repository ppa:jeffreyratcliffe/ppa
для 10.04 пока там пусто... но может не у всех как у меня чуство ускоренного времени )))
для 10.04 пока там пусто... но может не у всех как у меня чуство ускоренного времени )))
блин... не дочитал вопрос... именно распозновать я не пробовал, просто картинки
Программа 'gscan2pdf', возможно, подойдет вам.
Официальный сайт:
http://gscan2pdf.sourceforge.net/
Она является графической. Если точнее, то она является внешней надстройкой для консольных утилит. Она поддерживает распознавание текста через 'gocr', 'tesseract' и 'ocropus'. Возможно, что получится работать с русским языком.
Не могу не отметить, что просто для сборки tiff'ов в один файл djvu удобно использовать следующий скрипт (требует наличия djvulibre):
Официальный сайт:
http://gscan2pdf.sourceforge.net/
Она является графической. Если точнее, то она является внешней надстройкой для консольных утилит. Она поддерживает распознавание текста через 'gocr', 'tesseract' и 'ocropus'. Возможно, что получится работать с русским языком.
Не могу не отметить, что просто для сборки tiff'ов в один файл djvu удобно использовать следующий скрипт (требует наличия djvulibre):
#!/bin/bash
DEFMASK="*.tiff"
DPI=600
OUTFILE="out.djvu"
MASK=$DEFMASK
for i in $MASK; do
if < ! -e $i >; then
usage
echo "Error: current directory must contain files with the mask $MASK"
echo
exit 1
fi
if < ! -e $i.djvu >; then
echo "$i"
cjb2 -dpi $DPI $i $i.djvu
fi
done
djvm -c $OUTFILE $MASK.djvu
for i in $MASK; do
if < -e $i.djvu >; then
rm -f $i.djvu
fi
done
Данный написан скрипт для черно-белых(bitonal) изображений, что удобно для сборки после работы с scantailor.
Для цветных и "серых" нужно использовать другие кодеки.
Их описание можно найти на этой странице:
http://djvu.sourceforge.net/doc/index.html
Для цветных и "серых" нужно использовать другие кодеки.
Их описание можно найти на этой странице:
http://djvu.sourceforge.net/doc/index.html