Loading...
Error

Библиотека Либрусек по состоянию на 24 июля 2012 Полная коллекция (313294) книги [FB2/не-FB2] (Официальная, обновляемая версия) (KaiserTeam edition)

Страницы:   Пред.  1, 2, 3 ... 9, 10, 11 ... 60, 61, 62  След.

Ответить на тему

 | 

 
Автор Сообщение

kaiser09

Garuda
эххххх.. для начала делаю "правильные" дампы Либрусека, а то с этими "дырами" мало толку от него :-(
в апреле доделаю, если все по плану пойдет и не выйдут новые "улучшайзеры" на Либрусеке...
а уж потом можно и сделать быстро агрегированную.. там то понятно все: "правильные" дампы Либруеска и к ним добавить недостающие книги с Флибуста.. + подправить авторов и серии, а то они "разбежались" в обеих библиотеках

Garuda

Тов. kaiser09,
я в Вас верю.
Ведь, судя по аватарке, Вы - "Железный" ;)

unik_d_s

Спасибо железному kaiser09 и всей его команде - великое дело делаете!
Просветите, пожалуйста, как будут обстоять дела в агрегированной сборке:
Будут ли удалены из библиотеки и из базы данных все повторяющиеся книги? Сейчас, я так понимаю, что они выделены другим цветом: где-то красным, а местами черным. Если будут, то я так понимаю, что грядет полная перепаковка всех архивов тысячников?
Или агрегация будет производиться по другому принципу? Просветите пожалуйста поконкретнее, чтобы понять к чему готовиться.

kaiser09

unikds
работы приостановлены, пока не наведем порядок в Либрусековской. Причина - "дыры" в дампах и архивах Либрусека + на сегодняшний момент остановлен на добавление книг Либрусеск. Ожидаемый срок окончания работ в коллекции Либрусека - апрель если после открытия Либруеска не будут "подарков" в виде "улучшайзрв" от Ларина.

По агрегированной я уже пояснял. Поясню еще раз:
- за основу берется Либрусековская сборка
- к ней добавляются книги с Флибусты, которых нет на Либрусеке
- авторы, серии, жанры будут выправлены и поэтому не совпадут с Либрусек-Флибуста.

Архивы формируются по принципу: то что есть в Либруесковских + новые архивы с книгами отличными от Либрусековских с bookid, начиная с 1000001. Таким образом, можно продолжать будет добавлять книги с Либрусека и накапливать, отличные от него книги. Дампы БД свои и поэтому обноления каталога с Либрусека-Флибусты будет невозможно автоматически. Основой каталогизатор будет LibRusLib, но для MHL будут формироваться inpx.

vitalya_pn

kaiser09 писал(а):

vitalya_pn
по выкачке:
вариантов два:
1. качать полную, в которой есть отдельно fb2 и usr
2. качать мою полную

по пересечению: если пересекаются, то в LibRusLib'е возьмет поледнюю по встречаемости, в MHL по идее тоже. отсюда вывод: храним лишнее в таком случае.
В общем, мой Вам совет: внимательно посмотреть свои архивы и продумать как Вы будете делать для себя коллекцию и с каким каталогизатором. Примите решение, напишите - подскажу правильную стратегию как этого добиться
спасибо Smile но я так понял что скоро можно ждать агрегированную сборку, поэтому думаю смысла пока качать USR нет. правильно?

kaiser09

vitalya_pn
вообще то, в нашей сборке они совместны с fb2 в одних архивах. Если Вы про официальные ежемесячные от Корейца, то с ними не гарантирую ничего - скорее всего, заработает, но не проверяли

Splinty

Друзья, я бы конечно мог скачать и проверить, но проще спросить. MyHomeLib будет работать с этой сборкой? Или у Феликса свой путь? Я тут новичек, так что не обессудьте... Понять не могу... Мало того, что две библиотеки Флибуста и Либрусек, так еще и два разных каталогизатора со своими форматами да?

kaiser09

Splinty
inpx будут только со следующего обновления и то только пока для fb2. Пока тут inpx нет для MHL
Если кто то желает поэкспериментировать, то путь подскажу: возьмите lib2inpx с форума MHL (cоздание inpx от rupor) и можете попробовать создать...
мой inpx будут со следующего обновления сборки

Splinty

Благодарю за труд, спасибо за ответ! Успехов!

jornada

176882, 251761, 129556, 137215 - не открывается
164453 - вместо текста открывает архив с файлом, сам текст из архива извлекается. 164453 - по названию тоже самое, но не открывается совсем.

SserjIR

kaiser09 писал(а):

Splinty
inpx будут только со следующего обновления и то только пока для fb2. Пока тут inpx нет для MHL
Если кто то желает поэкспериментировать, то путь подскажу: возьмите lib2inpx с форума MHL (cоздание inpx от rupor) и можете попробовать создать...
мой inpx будут со следующего обновления сборки
К сожалению с нынешним состоянием дампов либрусека этот путь немного затруднителен и это не спасет нас, пользователей MHL, когда наконец выйдет долгожданная сборка лирбусек+флибуста.
Я сейчас пошел другим путем, делаю утилитку для формирования inpx-ов из базы LibRusLib, но ввиду недостатка свободного времени думаю доделаю только к концу марта.

kaiser09

SserjIR
libRusLib тоже на дампах Либрусека построен... хрен редьки не слаще.. LibRusLib удобнее проверять и корректировать свою (LibRusLib) бд.
C fb2 понятно все - парсить и парсить архивы, добавляя строки хоть в БД, хоть затем добавлять из inpx...
с usr сложнее: с OCR то можно справиться, с не-OCR приходится обращаться на страницу Либрусека

jornada

У меня сложилось ощущение, что процентов 10-15 книг из всей библиотеки открыть невозможно. Это ощущение или это действительно так?
Уважаемый kaiser09, Вас интересуют ID неоткрывающихся книг или может это известная проблема, которая будет решаться иначе?

kaiser09

jornada
интересуют id. правлю: что то в архивах, что то в дампах, чтобы вывести коллекцию в максимум близкую к 100% наполнению

ksv1

Наконец то скачал данную коллекцию,но....открыл кулинарию в pdf и djvu и что то через раз книги не открываются,странно однако!Это с дампами глюк или с архивами?
Показать сообщения:    
Ответить на тему