Главная· Трекер· Поиск· RSS· Правила· FAQ· Группы· Пользователи · «Буквица» |
Loading... |
Error |
Pdf & Djvu Bookmarker - программа для создания/пра
|
Главная » Вопросы по трекеру » Правила, FAQ'и, инструкции » Помощь в создании эл. книг |
| |
|
Автор | Сообщение |
---|---|
Старпом |
Pdf & Djvu Bookmarker
Программа для создания и редактирования дерева оглавления в djvu и pdf файлах. Работает в режиме wysiwyg, т.е. редактируется именно дерево в том же виде, какое оно будет иметь после открытия книги с оглавлением в просмотрщике. В отличие от аналогов программа имеет возможность просмотра страниц книги. Программа написана на C#, распространяется с открытыми исходниками. Требует установленного на компьютере пользователя .NET Framework 2.0. Язык интерфейса можно переключать между русским и английским. Основные ссылки: Качать отсюда: Страница проекта на SourceForge.net Тема обсуждения проекта на Ru-Board Вики-документация проекта Входные данные для программы: 1) текст оглавления, предварительно скопированный в буфер обмена из какого-либо источника (о возможных источниках данного текста можно посмотреть ниже в описании первого этапа). 2) html-файл в формате Bookmark Tool 2.0 - по сути, файл проекта программы. Может использоваться для промежуточного сохранения дерева оглавления. 3) djvu или pdf файл с уже внедренным электронным оглавлением. Например, если нужно поправить текст элемента оглавления или связь элемента оглавления со страницей djvu-документа. 4) txt-файл с заданными табами отступами. При выборе в качестве источника входных данных варианта 2) или 3) этапы 1 и 2 не проходятся. Основные этапы работы с программой: 1. Приведение текста оглавления к стандартному виду. Если в книге есть текстовый слой, то нужно просто выделить текст на всех страницах с оглавлением с помощью djvu-просмотрщика, скопировать его в буфер обмена и импортировать из буфера обмена в Bookmarker. Если текстового слоя в книге нет, то можно выгрузить требуемые страницы в изображения стандартными средствами WinDjView и распознать их с помощью FineReader, CuneiForm (в пакетном режиме) или Tesseract-OCR newocr.com (правда, результаты Tesseract пока не впечатлили). 1. Извлечение страниц оглавления из djvu-файла. а) В WinDjView в панели Страницы с Shift'ом выделяем страницы, содержащие оглавление. б) ПКМ по выделенным страницам - Экспорт страниц.. - выбираем формат tif - сохраняем в желательно пустую папку. 2. Распознавание а) Запускаем программу "Пакетное распознавание" б) Меню - Действия - Создание нового пакета в) Имя пакета несущественно - Далее г) Если в оглавлении нет английских символов выбираем русский язык, обязательно ставим галочку Одна колонка - Далее д) Добавляем папку, содержащую экспортированные на первом шаге изображения страниц - Далее. е) Далее ж) Добавляем "Форматированный текст" в сохраняемые форматы - ОК. з) Жмем кнопку "Распознать" (большая кнопка с очками в панели инстументов). 3. Склейка текстовых файлов в один. Нужна, потому что CuneiForm создает отдельный текстовый файл для каждого распознанного изображения пакета. Достаточно запустить bat-файл с командой copy *.txt toc.txt После чего все страницы объединятся в один файл toc.txt. На данном этапе реализованы следующие возможности: а) проверка ошибок нумерации в тексте оглавления, а именно выполнения двух простых условий: 1) Каждая строка оглавления должна оканчиваться числом. Это число будет интерпретировано программой как номер бумажной страницы, на которую ссылается данная строка. 2) Номер странице в текущей строке оглавления, должен превышать или быть равным номеру в предыдущей строке. в случае наличия в тексте оглавления строк, не удовлетворяющих данным условиям, программа запрещает переход на следующие этапы работы с оглавлением, пока все ошибки не будут исправлены. 1) Программа позволяет загрузить djvu-файл и просматривать его постранично в правой части своего окна. Это позволяет всегда держать перед глазами ту страницу оглавления, текст которой сейчас правится. 2) В случае, если ошибки вызваны переносом строк оглавления в книге, программа предоставляет специальные команды для склейки таких переносов. 3) При щелчке по списку ошибок (или при переходе на следующую/предыдущую ошибку с помощью команд программы) просходит автоматическое выделение строки оглавления, содержащей ошибку и ей передается фокус ввода. 4) Предусмотрена команда автоматической замены номеров страниц, заданных римскими цифрами, на соответствующие арабские цифры. 5) Часто используемые команды представлены как в виде экранных кнопок, так и в виде команд с клавиатуры и мыши. Например, листание страниц книги производится с помощью правой и левой кнопок мыши. Также реализована очень мощная команда задания структуры по шаблону - с ее помощью для нумерованных элементов оглавления, а также глав, разделов и т.д. структура задается в автоматическом режиме. 4. Сохранение результата Предусмотрено три способа сохранить результат работы над электронным оглавлением: 1) в html-файл, например, для промежуточного сохранения результатов при работе над большим оглавлением. 2) в текстовый файл. 3) в djvu или pdf файл. Просто укажите местоположение на диске существующей книги, и в нее будет внедрено электронное оглавление. Если книга ранее выбрана для просмотра, можно сохранить оглавление в нее выбором пункта меню Сохранить. Желательно оставлять комментарии, имеющие отношение только к функционалу проекта. Данный топик НЕ является местом для озвучивания своего личного отношения к компании Microsoft и ее технологиям, в частности к .NET Framework. Автор темы: 57an |
Страница 1 из 1 |
Главная » Вопросы по трекеру » Правила, FAQ'и, инструкции » Помощь в создании эл. книг |