Цитата:
Сообщение от Samurai
В пдф сильно большой файл получится, даже в Djvu первый том будет, около 20Mb. Только в таком формате все равно будет гемор с распознаванием текста.
Кто в курсе, fineereader поддерживает dvu?
|
Я делал электронные версии некоторых книг (например, этой:
http://forex.kbpauk.ru/showflat.php/...80/an/0/page/0) по схеме, предложенной здесь:
http://www.djvu-soft.narod.ru/b_cr.htm .
Основные этапы таковы:
1. Сканирование в растровый формат. При сканировании по возможности ложить страницы на одно и то же место, и давать файлам однотипные имена вида
"имя_книги_XYZ", что XYZ-порядковый номер снимка, чтобы упростить процесс обрезки полей (процесс именования файлов можно автоматизировать, а потом, на этапе обрезки, отделить левые страницы от правых по признаку чётности номера).
2. Автоматическая обрезка полей с помощью программы IrfanView.
3. Сжатие в DJVU с помощью Document Express Enterprise, с сохранением разпознанного текстового слоя (OCR).
Просматривать можно любым просмотрщиком формата DJVU (придётся уж установить, ибо софт от "мелгомягких" на это не способен), например, DjvuReader, либо plugin web-браузера.
Кстати, я не думаю, что 20 мб - это много для такой большой книги. "Техника дезъинформации и обмана" по объёму раз в 5 меньше, и "весит" около 3 мб, т.е. примерно пропорционально меньше.