Показать сообщение отдельно
Старый 06.08.2009, 16:21   #89
Небесный
Ушёл в баню
 
Регистрация: 02.08.2009
Адрес: Небо
По умолчанию

Цитата:
Сообщение от Samurai Посмотреть сообщение
В пдф сильно большой файл получится, даже в Djvu первый том будет, около 20Mb. Только в таком формате все равно будет гемор с распознаванием текста.
Кто в курсе, fineereader поддерживает dvu?
Я делал электронные версии некоторых книг (например, этой: http://forex.kbpauk.ru/showflat.php/...80/an/0/page/0) по схеме, предложенной здесь: http://www.djvu-soft.narod.ru/b_cr.htm .
Основные этапы таковы:
1. Сканирование в растровый формат. При сканировании по возможности ложить страницы на одно и то же место, и давать файлам однотипные имена вида "имя_книги_XYZ", что XYZ-порядковый номер снимка, чтобы упростить процесс обрезки полей (процесс именования файлов можно автоматизировать, а потом, на этапе обрезки, отделить левые страницы от правых по признаку чётности номера).
2. Автоматическая обрезка полей с помощью программы IrfanView.
3. Сжатие в DJVU с помощью Document Express Enterprise, с сохранением разпознанного текстового слоя (OCR).

Просматривать можно любым просмотрщиком формата DJVU (придётся уж установить, ибо софт от "мелгомягких" на это не способен), например, DjvuReader, либо plugin web-браузера.

Кстати, я не думаю, что 20 мб - это много для такой большой книги. "Техника дезъинформации и обмана" по объёму раз в 5 меньше, и "весит" около 3 мб, т.е. примерно пропорционально меньше.

Последний раз редактировалось Небесный; 06.08.2009 в 16:37
Небесный вне форума   Ответить с цитированием