Loading...
Error

close

Ответить на тему

 | 

 
Автор Сообщение

rab

close

vassa2

Хмм... Я, конечно, заранее извиняюсь и прошу не кидать в меня валенками. Все это только мое частное мнение, и книжек я наделал может десятка два, в основном для себя.

Создание книги в любом виде - это прекрасно.

Но давайте не усложнять жизнь себе и другим.

Для книжек без картинок (или с немногими) - то, что называется "художественная" литература - есть формат . fb2 - де-факто в рунете.
Посмотрите Fiction Book Designer http://lib.rus.ec/b/319144
Если уж отсканировали, распознали и ВЫЧИТАЛИ, то не дайте пропасть вашему труду.
И картинки в фб2 запихиваются совершенно на ура, особенно битональные иллюстрации.

На самый крайний случай есть скрипт doc2fb (если без ворда жисть уже не та)

Если в книжке есть картинки - на выбор - pdf или djvu.

Малокрасочные книжки быстрее и проще сделать в djvu - сканируете (в формат без потерь - tif или png - нынешние железяки позволяют и в 600 dpi без напряга), берете scantailor - вечер работы и электронная книжка точно в том виде, как была бумажная. Стали попродвинутее - разделяйте сканы на текст и рисунок (тем же ST separator), обрабатывайте, делайте качественно. Еще двинутей - изучайте ScanKromsator (это типо высший пилотаж - программа для осьминогов, двух рук там мало, как в линуксе только командной строкой пользоваться ag ).

Ну а если вам в руки попался томик определителя аквариумных рыбок - пдф вам в руки, и пусть размер файла перевалит за 100 мегабайт - принесем наши винты в жертву качеству ab (хотя порезать странички в сканкромсаторе не помешает и здесь, не запихивать же развороты вместе с вашими пальцами по краям в файл)

Хотите OCR для djvu/pdf - делайте. Не хотите - не делайте. Потому как если делать, то с вычиткой и любовно. После Файнридера (Прекрасного Чтеца) ТАКАЯ порнография другой раз получается, что лучше б не делали этого распознавания. А ЧИТАТЬ книгу можно и без OCR, нужна кому цитата для трудов научных - вот пусть и оцээрит в свое удовольствие.

rab

--

rab

--

vassa2

Да нет, я ничего не чистил, как было, так было.
Хотел отписаться, но зачем?
Постараюсь свой взгляд на предмет сегодня-завтра изобразить в отдельном топике

папаВлад

Интересный способ.
От себя добавлю, что гораздо безошибочнее пройдёт распознавание, если сканы будут в 600 DPI, либо они будут в 300, а затем пакетно увеличены в 2 раза (размеры сторон на 200% и DPI до 600).
Экономия времени на редактировании ошибок.

rab

--

rab

--

rab

--

vmakhankov

Цитата:

если худ. литература, там картинок обычно бывает мало (10-15 - это мало), поэтому смысл выкладывать их в раздаче отсутствует,
Я человек доброжелательный, но дочитав Ваш "опус" до этого места, товарищ, не дрогнувшей рукой влепил оценку "отстой". Т.е. имеем детскую книжку с роскошными рисунками (Иван-Царевич на Сером Волке за Еленой-Прекрасной скачут и т.д.) и эти картинки надо выбросить - их меньше 15! И зачем она нужна такая книга? И второе: Вы же книгу исказите, товарищ.
Не "отстой", а "полный отстой". Однозначно!!!

AlxKrzk

vmakhankov,
Мы с Вами, вероятно, по- разному интерпретируем слова автора "где картинок много (20-100), там создание отдельной папки с картинками очень востребован, т.е. текстовый документ и pdf+папка с картинками".
Я думаю, что автор имел в виду следующее:
1.Если картинок мало, то оставляем их прямо внутри итогового текста (*.pdf, *.FB2).
2.Если картинок много, то помимо текстового варианта целесообразно сделать дополнительную папку- только с картинками.

vmakhankov

AlxKrzk писал(а):

Мы с Вами, вероятно, по- разному интерпретируем слова автора
Совершенно верно. Для меня электронная книга копия бумажной, поэтому ВСЕ картинки-таблицы и прочие иллюстрации должны находиться на тех же местах, что и в бумажной книге. И без всяких там дополнительных папок.

rab

--

vmakhankov

009Art писал(а):

что openoffice искажает и ухудшает качество картинки,
После того как FR распознает книгу, надо её проверить - как FR определил границы картинок, при необходимости выставить их вручную и распознать эти страницы заново. Важно: раз мы установили границы рисунка вручную, то надо также вручную установить и границы текстовых блоков (на этой странице), иначе FR их пропустит.

rab

--
Показать сообщения:    
Ответить на тему