Что сделано на данный момент:
схема в mongoDB (не стал использовать MySQL)
настроен поиск с морфологией Sphinx, который, скорее всего, нужно будет еще настраивать, чтобы он выдавал то, что хочет пользователь
схематичный веб-интерфейс к этому всему, который сейчас поддерживает добавление книги(точнее текста книги) и полнотекстовый поиск
-- дизайна нет, с этим придется подождать
как устроено хранение книг:
таблица Book_contents:
id,
content: text - собственно абзац (либо параграф, страница и т.д. в зависимости от того, как разделяем текст книги)
таблица Book - содержит информацию о книге,
id,
autor: text,
title: text,
.....,
content является списком из ID book_contents
так (Book) One --> Many (Book_contents)
Т.е. входной текст книги разбивается на абзацы, которые индексируются Sphinx.
Что нужно сделать:
красивый дизайн+вёрстка
автодобавление индекса (после добавления пользователем книги передаём ее на индексацию) (займёт дня 2)
найти программу для преобразования doc в html, pdf в html, ...
catdoc на win64 не запускается, abiword вылетает с ошибкой (WTF?)
инструментарий:
python
flask
pymongo
mongoengine
flask-admin
sphinxsearch
если нужно выложу исходники на github
|