Раздача представляет собой результат санитарной обработки локальной библиотеки Либрусек по версии Ruslan_Smirnoff ([url]viewtopic.php?t=1198[/url])
А именно: в архивных файлах zip остались только книги, не помеченные в базе lib.rus.ec, как удаленные, на русском. украинском и белорусском языках. В результате сэкономилось около 21 гига.
Все книги перекодированы в utf-8, как наиболее универсальный и приемлемый стандарт, отлично читаемый любой операционной системой. Их заголовки (title-info) приведены в соответствие с данными базы lib.rus.ec, что позволяет корректно сканировать библиотеку каталогизаторами, если по какой-то причине невозможно или нежелательно использовать файл inpx. Актуально, в частности, для каталогизатора MyRuLib
Устранены мелкие глюки, порождающие ошибки xml. Также исправлены подмены кириллических символов внешне схожими латинскими ("р"-"p", "с"-"c" "х"-"x" "у"-"y" и т.д.) в именах авторов, названиях книг и серий, которые мешали нормальному поиску. В названиях упорядочена пунктуация (кавычки, тире и т.п).
Автоматически удалились копии книг, совпадающие побайтно (их было около 70). Около 1000 книг, в которых полностью совпадают названия и имена авторов, пока остались в библиотеке.
Как установить библиотеку и MyHomeLib - см. по ссылке выше, не буду повторяться.
В дальнейшем раздача будет обновляться сразу после обновлений Ruslan_Smirnoff.
Предложения, пожелания, матюки и наезды приветствуются (в рамках правил трекера, конечно).
Раздача обновлена - добавлены архивы fb2-000001-441999m.zip и fb2-437000-441999.zip, заменены архив fb2-158328-161830.zip и файл inpx. Перезалейте торрент!
И еще одно: при использовании inpx директорию коллекции указывайте _Lib.rus.ec Lite, а не _Lib.rus.ec Lite/lib.rus.ec.lite. Это мой косяк, в следующем обновлении поправлю.
oldmonk
Текущее состояние библиотеки:
Общее количество книг: 179 556
Количество авторов: 48 909
Суммарный размер файлов, Мб: 153 925 (неупакованные), 66 953 (в архиве).
oldmonk
koreec писал(а):
Круто, снимаю шляпу.
Спасибо
koreec писал(а):
Единственное ИМХО - я бы поостерегся чистить самый последний архив сразу после его выхода. На либрусеке часто бывают ситуации, когда свежезалитые популярные книги пытаются удалять копирасты, в результате книги-то восстанавливают, но в дампе книга будет числиться удаленной до следующего месяца.
Не лишено. Думаю, это вполне можно проверить вручную - если книга новая или вполне очевидный апдейт - оставлять в базе, а там будет видно.
Старпом
oldmonk Спасибо, здорово!
oldmonk
Не за что ;)
Xuer
oldmonk Колоссально! Мое почтение и благодарочка!
oldmonk
Xuer,
Olaf802
Спасибо!!!
oldmonk
Olaf802 писал(а):
Спасибо!!!
Не за что ;)
faska
Раздачу автора Wanraik качаю с момента ее появления Все это время смущало наличие огромного количества книг на иностранных языках(ну не изучил в бытность свою ни одного толком!)Но предстаив какого количества времени и трудозатрат затребует ручная чистка архивов-руки опускались Очередной раз убедился что мечты временами имеют свойство сбываться К вышенаходящимся отзывам от себя добавлю-ГРАНДИОЗНО!!!!Думаю что когда известие о вашей раздаче распострниться среди любителей чтения и имеющих у себя на компе библиотеки -поклонников у вас добавиться Respect вам С уважением-faska
Язычник666Вовкулак
За проделанную работу уважуха !!!Но все ли будет так гладко?Например: Фаррен Мик - вместо его книг почему-то открывается Мамин-Сибиряк(3 книги) и Пришвин(1).Или это только у меня?Еще нашел : Финкельштейн Сидни - открывается Рыжков Алексей.
oldmonk
Язычник666Вовкулак, спасибо большое, разберусь немедленно. У меня что написано, то и открывается, но я живу под Linuxом, пользуюсь MyRuLib, поэтому inpx не использую. Вполне возможно, что там есть какие-то ошибки. За день-два разберусь и, если что, перезалью inpx.
oldmonk
faska, спасибо за добрые слова, только, во-первых, трудозатрат не так уж много - 90% работы делают скрипты, а во-вторых, у меня не было выбора: каталогизатор MyRuLib - единственный нормальный под Linuxом, а он всех этих inpx не понимает, т.е. ему хочется самому сканировать библиотеку. Кто сканировал локальные библиотеки Либрусек, тот поймет: содержание заголовков файлов имеет с реальностью довольно мало общего, а невозможность отличить при сканировании, что удалено, а что нет, забивает каталог такой горой хлама, что не продерешься. Вот так и вышло, что пришлось сочинять скрипты и чистить исходный архив.
oldmonk
Язычник666Вовкулак, подтвердилось. Чтоб не заморачиваться, сейчас просканирую библиотеку с помощью MyHomeLib и экспортирую оттуда inpx, после чего заменю в раздаче и выложу в отдельный торрент.
Мои извинения всем за неудобства, первый блин таки немного комом...
faska
Верю автору раздачи что Файл librusec_lite_local_fb2.inpx глючный Одна только проблема-его скачали два пользователя и на данный момент на раздаче полный ноль Проблема однако! спасибо скачал