Loading...
Error

Библиотека Либрусек по состоянию на 24 июля 2012 Полная коллекция (313294) книги [FB2/не-FB2] (Официальная, обновляемая версия) (KaiserTeam edition)

Страницы:   Пред.  1, 2, 3, ... 61, 62, 63  След.

Ответить на тему

 | 

 
Автор Сообщение

kaiser09

ZET79
мне тоже. но есть довольно много тех, ко только fb2 качает и читает. поэтому и будет две

maslm

Я уже запутался в этих кучах разных релизов либрусека здесь и на torrent.eus.ec
Помогите распутаться. :-)

У меня сейчас имеется полный архив либрусека по состоянию на 1.11.2010, объемом более 120Гб, но я таких релизов более не вижу.

Как я понял, этот полный релиз решили раздавать раздельно с FB2 и не FB2 частью? Так это?
Спрашиваю, потому что меня интересует, могу ли я добавлять новые файлы в состав архива, просто скачав два торрента или они мне запортят весь имеющийся архив?

Очень бы не хотелось ради обновлений перекачивать 120-130 Гб.

kaiser09

maslm
cравните имена архивов и на основании этой информации можно только принять решение: помните только одну простую вещь - libruslib устроен так, что берет книги из архивов по номеру из последнего из имеющихся в списке архивов, отбрасывая префикс fb2 или usr.

По поводу моих обеих сборок коллекций - 26.12.2010 выйдет последний раз в этом формате, с 9-10 января будет немного другой формат, одна коллекция будет только fb2, вторая полная - fb2 и usr. В общем то, все это написано в описании раздач

maslm

kaiser09
Спасибо! Только я пользуюсь myrulib, она кажется берет книги по номеру без отбрасывания префиксов, проблема только в том, что к очередному обновлению, спустя месяц-другой, я каждый раз напрочь забываю откуда к ней качал базы на книги Smile Как-то оно неочевидно сходу, в отличие от libruslib .

kaiser09

maslm
в любом случае, по idbook проверяйте
fb2 то myrulib сам может индексировать, а вот usr... там "засада" у авторов - я видел у них только импорт с inpx для этого

spiritous04

kaiser09
Если можно, маленький теоретический вопрос. Всё-таки встречаются книги в списке либруслиба, которых нет реально в архивах, были среди них и fb2, и usr-ы. Книги эти попадались из числа удалённых на Либрусеке. Пока не видел ни одного случая, чтобы это были книги, которых нет в другом варианте (то есть есть всегда другой файл с этой книгой). Это не мешает, просто интересно, а не может ли каталогизатор либруслиб посчитать точнее?

spiritous04

Да, и спасибо, конечно, огромное за библиотеку! :-)

kaiser09

spiritous04
катологизатор сам ничего не может :-) он использует дамп БД Дибрусека, отсюда вывод - иакие книги приходится "отлавливать" и добавлять в БД ЛибРусЛиба
Или как я делаю - импортирую в свою БД дамп Либрусека, а LibRusLib'у "скармливаю" не дам БД Либрусека, а дамп своей БД, так как она у меня получается более полная. Архивы песня отдельная - как раньше полагаться на ежедневные архивы нельзя, так как их больше нет, поэтому делается комбинация из официальных "тысячников" и моих собственных неофициальных ежедневных.
Вам пока везло с недоступными файлами - довольно много usr не хватает в архивах, fb2 поменьше - они многие, действительно, были замещены исправленными версиями.
тот вариант, который сейчас здесь выложен - по старым источникам сделан, страдает "дырами" в архивах, усугубленных несколькими "улучшениями" Либрусека, перекомпоновками в 2009 году, в 2010-м. С января будет полная версия - проверили и собрали все архивы Либрусека, все почти 210 000 книг, не хватает только около десятка, но они и недоступны на Либрусеке или совсем "битые" с нулевым размером...

spiritous04

kaiser09
Ага, понял, спасибо! Ну у вас реально оптимум. Я бы, допустим, предпочёл майхоумлиб с инпиксом, так как он работает чуть быстрее, но ваша база лучше инпиксов встречавшихся коллекций.

Alex_61

kaiser09
Сижу на известной раздаче с весны; в связи с ее очевидной смертью теперь вот встал вопрос о том, как бы поиметь полную же коллекцию, но несколько посвежее.
Не могли бы вы кое-что уточнить?

Цитата:

По поводу моих обеих сборок коллекций - 26.12.2010 выйдет последний раз в этом формате, с 9-10 января будет немного другой формат, одна коллекция будет только fb2, вторая полная - fb2 и usr. В общем то, все это написано в описании раздач

Цитата:

C 2011 года формат коллекции изменится. Группа KaiserTeam выпускает полную коллекцию библиотеки Либрусек за все время ее существования c 2007 года. Все архивы выверены, начиная с 1-ой книги и до последней на момент выпуска, в том числе и до реструктуризации (чисткой и перепаковкой) 15 мая 2009 г. Коллекция не будет совместима с известными, так как прошла полная перекомпоновка и выверка архивов книг и дампа БД Либрусека. Будут все почти 210 000 книг, включая удаленные, дубли и т.д.
1. Файлы в указанной выше раздаче действительно не подгрузятся в новую полную коллекцию вашей команды?
Т.е. из ваших слов это следует прямо, однако мало ли... Жалко же стирать потом будет... Можно поподробнее?
2. Любые сборки вашей команды сейчас качать смысла нет, если в будущем (январе 2011 года?) качать новую полную версию, что я и планирую делать?
3. Эта январская (?) новая полная сборка будет включать в себя либрусечные и только либрусечные книги (в переработке и чистке) или же это будет некая "агрегированная" сборка разных библиотек, наиболее полная, на взгляд вашей команды? Т.е. типа Библиотеки Траума, этакого сборника?
4. Наконец, несколько слов о том, как и по каким критериям планируется эту новую сборку обновлять?
Спасибо.

kaiser09

Alex_61
по Вашим вопросам по порядку
1. невозможно подгрузить: реструктуризация прошла полная, так как мы собрали все существующие архивы книг Либрусека, а значит все кеши предудущих версий не сойдут с нашими архивами.
2. полная версия выйдет около 9-10 января будущего года в описании выше. будут как fb2 так и usr-архивы
3. Здесь да, только Либрусековская, агрегированная будут совместима на первом выпуске с этой новой - затем разойдется. Агрегированная на первом этапе будет включать книги Либрусека (все) + книги с Флибусты (каких нет на Либрусеке) + Траума (каких нет на Либрусеке и Флибусте), затем будем думать, что еще добавлять
4. порядок обновлений не изменится - раз в две недели (это касается и полной Либрусековской и агрегированной)

Alex_61

kaiser09
Оперативно как ab
Предварительно получается, что будет та еще няшка.
Спс!

Garuda

kaiser09,

скажите, плиз:

1. Не планирует ли Ваша команда сама создать каталогизатор, "заточенный" именно под Вашу полную либрусековскую/агрегированную сборку, и вобравший лучшие стороны майхоумлиба, либруслиба, аллмайбука и айсбука?

2. Не планируете ли Вы включить в состав Вашей агрегированной сборки архивы Натахаус?

kaiser09

Garuda

1. пока не планируем свой отдавать каталогизатор - слишком он специфичен, а довести до пользовательского, упростив, времени нет
2. пока нет - все равно оттуда в Либрусек переходит многое из интересного - сам переношу многое

Alex1

Kaiser09

Сравнил оф. архивы с обновленными

Кайзера fb2-216642-224152.zip

книги 219243.fb2 и 219302.fb2 имеют расширение не fb2, а .pdf и .djvu (см. LRL).
Их нужно переименовать и перенести в usr- архив.

Кайзера usr-216903-224152.zip 120 отличающихя (старый вариант архива. В новом отличий 168)
есть битые файлы где-то около 219021-25

оф. раздача тот же диапазон 57 отличающихся файлов.

далее сравнил
Архивы Кайзера
usr-228000-232601.zip выборка 230010-232594
usr-232602-238095.zip
usr-238096-242811.zip выборка до id 241986

оф. архивы
usr-230000-236999.zip
usr-237000-241999.zip

у Кайзера 386 отличающихся
В оф. 123 отличающихся

Во всех сравнениях выигрывает сборка Кайзера09, но в ней отсутствуют сотня-другая книг, которые есть в оф. раздачах.
Качать и те, и другие неудобно. Хранить ради 180-250 книг копии с двух раздач тоже. Модифицировать самому, с учетом работы с MHL, приходится опираясь на оф. архивы (к ним есть inpx) и создавая доп. архивы из файлов от кайзера. LRL из раздачи пока использую как базу данных. После разделения с оф. раздачей до id 241999 у Кайзера09 больше на 1298 книг (все форматы).

Вопросы:
Стоит ли и дальше сравнивать наполнение здесь и в оф. раздаче?
Сообщение "Группа KaiserTeam выпускает полную коллекцию библиотеки Либрусек..." говорит также о завершении 1 этапа работ по агрегации или просто выходе образцового зеркала Либрусека, без обычных ошибок?

Предложения:
Что касается книг "запредельного" размера: сканов *.pdf, *.doc 200-300 Мб, которые будут переработаны в *.fb2, нужен механизм их безболезненного удаления. Не вижу смысла хранить их после появления файлов меньшего размера. Как вариант, запаковать такие в архив для гигантов.

Сейчас книги Либрусека имеют вид "имя.расширение" и "id.расширение". Некоторые дополнительно запакованы в архивы (zip, rar, 7z). Где-то была сборка журналов за год (12 выпусков) в одном архиве. В БД все они шли одной строчкой и одним id. Логично привести все к одному виду "id.расширение", и избавиться от вложенных архивов.

Сделать архивы KaiserTeam-Либ v.1.0 удобного для записи на dvd-5 размера. Или архив-диск, или 2 архива-диск. В идеале, придерживаться такого размера и далее.

Если выбрана структура "россыпью" для отлова дублей-удаленных-недописанных, просьба выделить каждый язык в свою папку. Как пример - сборка Траума.

Включить поддержку MHL для новой библиотеки, хотя бы для агрегированной сборки.
Показать сообщения:    
Ответить на тему