Видео смотреть бесплатно

Смотреть русский видео

Официальный сайт osinform 24/7/365

Смотреть видео бесплатно

03.07.10 15:40 andreas

Есть вопрос!Документооборот, сканирование и хранение?

Привет!

Мой первый пост, так что сильно не бейте...
Я храню все приходящие бумажные документы на компьютере и сервере, чтобы было их проще искать и можно было бы добраться до них не из дома.

Когда начинал, пользовался Windows и поэтому просто сканировал в Adobe Acrobat, он сам распознаёт текст и делает pdf с возможностью поиска. Сохраняю пока просто на диске в папках. Давно перешёл на линукс, но т.к. с разгону ничего подходящего не нашёл, сканирую всё ещё в VirtualBox + WinXP + Acrobat. Хочеться перейти.

Вопрос 1: есть ли что-то готовое / лекго-адаптируемое для линукс?
Т.е. в идеале хотелось бы: положил на сканер, нажал кнопку, дал название -> pdf с картикой и текстом на заднем плане (чтобы искать/выделять). SANE в принципе умеет сохранять в pdf, т.е. вариант был бы прикутить к ней "OCR для PDF" или что-то такое.

Вопрос 2: посоветуйте хранилку для этих документов на сервере, с web-мордой.
Хотелось бы с хорошим поиском, тэгами / групировкой по тэгам. Очень хотелось бы thumbnails, а то и вообще пред-просмотр, типа как в google-docs. Т.е. что-то специально для документов, пока пользуюсь просто AJAXExplorer.

Спасибо за помощь!
Andreas



Username 03.07.10 15:43 # +2
http://www.linux.org.ru/news/opensource/5068561
andreas 03.07.10 16:32 # +1
По твоей ссылке написано Результат распознавания может быть сохранен в форматах HTML, hOCR, RTF или PDF, а в самой программе к сожалению:
1
2
3
4
5
6
7
8
Unknown format pdf.
Supported formats:
    html         HTML format
    hocr         hOCR HTML format
    native       Cuneiform 2000 format
    rtf          RTF format
    smarttext    plain text with TeX paragraphs
    text         plain text

andreas 03.07.10 21:42 # +2
Подумал ещё, вообще-то неплохо... scanimage+convert даёт bmp, из распознавалки получаем txt. Осталось только получить searchable pdf из bmp+txt. Может кто знает как? В крайнем случае делаем простой pdf из bmp тем же convert'ом и сохраняем текст в БД для поиска.... Вполне ничё, можно пользоваться.
Username 04.07.10 13:12 # +0
txt2pdf есть
Вообще в pdf можно из очень многого конвертить, самый Ъ-способ - из xml в po, из po в pdf.
andreas 03.07.10 23:18 # +2
Нашёл тулзу, которая делает из hocr и bmp searchable PDF, hocd2pdf зовётся, в ubuntu есть она ввиде пакета exactImage. В федоре не могу скомпилировать... но может какому убутярию будет интересно.

Посты Комментарии
Последние посты
    Посты Комментарии
    Последние комментарии
      Посты Комментарии
      Изменения
        Посты Комментарии Изменения Черновики Избранное
        Черновики (все)
          Посты Комментарии Изменения Черновики Избранное
          Избранное (всё)
            Посты Комментарии Изменения Черновики Избранное
            Лучшие блоги (все 127)
            Топ пользователей Топ блогов
            Топ пользователей Топ блогов
            Элита (все 2335 из 192 городов)
            Топ пользователей Топ блогов
            В сети: doraneko, pumbur, shidoh, le087, todeus

            Новенькие: treylav, Net-burst, kww61, sokrat, demerzel
            welinux.ru

            В хорошем качестве hd видео

            Онлайн видео бесплатно


            Смотреть русское с разговорами видео

            Online video HD

            Видео скачать на телефон

            Русские фильмы бесплатно

            Full HD video online

            Смотреть видео онлайн

            Смотреть HD видео бесплатно

            School смотреть онлайн