Loading...
Error

Библиотека Либрусек (lib.rus.ec) Lite (только актуальные, языки ru, uk, be, FB2) по состоянию на 13-07-2013 + MyHomeLib. [oldmonk edition]

Страницы:   Пред.  1, 2, 3 ... 5, 6, 7 ... 9, 10, 11  След.

Ответить на тему

 | 

 
Автор Сообщение

Xuer

balbert
Выложил бы, очень многие были ли благодарны, я в том числе.

balbert

Xuer писал(а):

balbert
Выложил бы, очень многие были ли благодарны, я в том числе.
Нет возможности организовать раздачу.
Предлагал свою коллекцию Либрусека Old Librarian, но он отказался.
Сейчас коллекция весит 619 368 719 357 байт (в архивах-тысяниках) и последний bookid 438698.
С таким размером коллекцию вряд ли кто будет качать.

regidrer

Обе полные коллекции либрускка и флибусты 453.82+238.39=692,21
Получается, что дублей всего около 14%! ai
Ну это можно считать подоходным налогом av

oldmonk

Говоря откровенно, единственный смысл, который я вижу в "полных" (т.е. с включением всех когда-либо закачанных в библиотеку файлов) сборок - коллекционерский. Даже во вполне почищенной и ухоженной Либрусек, среди файлов, не помеченных, как удаленные, после обработки 10% от общего количества обнаружилось 220 книг, почти точно повторяющих другие. Т.е. по итогу будет, наверное, около 2 000. В "нечищенной" версии их далеко за 30%, если не под 50%, впрочем, могу как-нибудь точно посчитать.
Если такую библиотеку обработать каталогизатором, появляется вторая проблема - регулярно заголовки не имеют ничего или почти ничего общего с собственно книгой. Обработчики путают имена с фамилиями, фамилии с заголовками, заголовки с аннотациями и т.д. Как работать с такой библиотекой - не представляю.

Если неправ - поправьте.

P.S. regidrer, во либрусеке и флибусте своих дублей - как у дурака махорки...

balbert

regidrer
Я указал размер только библиотеки Либрусек.
Флибуста у меня весит 269 625 379 952 байта

Абхаз

balbert писал(а):

b
-раздачу будут качать-либген не потянуть-а 630 гигов сдюжим

Xuer

balbert
Я бы забрал. на сегодняшний день чуть более чем пол тера на диске для достойной библиотеки не вопрос. Под гораздо менее нужные вещи больше места выделяем, кино там всякое, которое в лучшем случае раз посмотрим и т.д. А под книги дело святое вообще.

Sashka_1959

Всем привет!
У меня вот такое... получилось.
Подскажите, будьте добры, в чём проблема?

http://ifotki.info/14/d547ef03c28f18900940debbcecf4...4626791.jpg.html

oldmonk

Sashka_1959, причина такой фигни - неправильная кодировка, скорее всего в базе данных. В следующем обновлении будет исправлено, спасибо, что подсказали.

Sashka_1959

oldmonk
СПАСИБО!

oldmonk

Sashka_1959, пока что не за что ;)

oldmonk

Закончил работу над версией LibRusEc Clean. От Lite она отличается тем, что устранены дубляжи названий разных по сути книг у одних и тех же авторов (рассказы, сборники, разные переводы и издания и т.п.), а сами авторы упорядочены, т.е. одного и того же автора, к примеру Чамберса Энди, не зовут теперь еще и Чэмберс Энди или Чемберс Анди.
Переименовано около 3700 книг (как правило, добавлены комментарии в скобках типа "илл.", "изд. 2000 года", "переводчик ТакойТо", "сборник" и т.п.). Чуть более 1400 - удалены (дубли). Авторов стало меньше на 242.

Вопрос - оно вам надо? А если да, то какие будут предложения по формату, частоте и способам обновления и т.д.?

ratta

oldmonk, Ответ - очень надо. Удобно ли будет поддерживать в актуальном состоянии "Light" и "Clean"? Может быть стоит сосредоточить усилия на одном направлении? Меня бы устроили обновления один раз в два-три месяца. Формат - очень хорошо упакованный (что то вроде xz -9e) индексированный архив (можно с избыточностью) который можно смонтировать. Например squashfs, pixz или что-то похожее. Было бы неплохо в каждый релиз включать базу для MyRuLib

Xuer

как я понял, LibRusEc Clean еще чище, а значит лучше чем LibRusEc Lite, а значит естественно необходима и более удобна и практична. лично я заберу с удовольствием, впрочем, как и большинство "прохававших" ху ист ху данную библиотеку.

oldmonk

ratta, Light - полуфабрикат для Clean, поэтому будет вполне удобно. Насчет формата - squashfs вполне реально, только надо ли? Я вижу два варианта: iso а-ля Траум, плюс привычный народу набор zip-архивов, iso обновлять опять таки как Траум, а zipы добавлять, как и в Light. Но и squashfs не проблема - это тот же iso, только сжатый и в другом формате. Ну и базу для MyRuLib, естественно.

При этом для пользователей Linux могу выпускать ежедневные обновления в формате diff и обновления базы MyRuLib в sql. Правда, им придется пожертвовать дисковым пространством и держать библиотеку распакованной.

Xuer, Clean не столько чище Light (полторы тысячи лишних книг - менее 1%), сколько удобнее: не нужно ломать голову, та ли это книга, того ли автора и почему их пять с одним и тем же названием?
Показать сообщения:    
Ответить на тему