Loading...
Error

Библиотека Flibusta (только FB2) на 01.05.2024 (626054 книги) (локальная коллекция, пополняемая ежемесячно) + MyHomeLib + inpx

Страницы:   Пред.  1, 2, 3 ... 220, 221, 222 ... 228, 229, 230  След.

Ответить на тему

 | 

 
Автор Сообщение

wowan_zh

Artykl
В этой библиотеке 22 пустых книги:
Если названия твоих "пустышек" совпадают со снимком, то все нормально! Если нет, то придется перекэшировать раздачу. Используй оболочку MultiLib в моей раздаче " MultiLib 1.11 для библиотек _Lib.rus.ec - Официальная, fb2.Flibusta.Net (fb2)" вместо MyHomeLib, она все нулевые книги отсекает.

Silfrida

Добрый день!
Пользовалась уже архивом, все было прекрасно!
Очень благодарна за труд держателей торрента. ba ba ba

Однако пришлось тут поменять пк и все делать заново. скачала всю раздачу целиком, но при попытке запустить MyHomeLib выскакивает ошибка "Файл коллекции отсутствует. Невозможно запустить программу". И если нажать на "ОК", то инсталлер запускается, но при выборе файла Inpx, на этапе выбора имени и расположения коллекции, ругается "Коллекция уже существует!"
Но это невозможно, потому что пк чистый и никаких коллекций я не создавала.

В общем, вопроса два:
1) что за файл коллекции требует MyHomeLib?
и
2) если это не первый такой вопрос, то подскажите, где почитать - поиск по сайту не дал результатов(

Silfrida

А еще к вопросу выше

Crystal писал(а):

в) Распаковываем в ту же папку архив MyHomeLib_latest.* (если таковой имеется) из данной раздачи или скачанный с сайта программы.

Crystal писал(а):

в раздачу включены программа-каталогизатор MyHomeLib (http://home-lib.net),
В раздаче такого файла не нашла. Может, в нем проблема? Сайт по ссылке из шапки не работает даже с впн...

Silfrida

Silfrida писал(а):

Добрый день!
Пользовалась уже архивом, все было прекрасно!
Очень благодарна за труд держателей торрента. ba ba ba

Однако пришлось тут поменять пк и все делать заново. скачала всю раздачу целиком, но при попытке запустить MyHomeLib выскакивает ошибка "Файл коллекции отсутствует. Невозможно запустить программу". И если нажать на "ОК", то инсталлер запускается, но при выборе файла Inpx, на этапе выбора имени и расположения коллекции, ругается "Коллекция уже существует!"
Но это невозможно, потому что пк чистый и никаких коллекций я не создавала.

В общем, вопроса два:
1) что за файл коллекции требует MyHomeLib?
и
2) если это не первый такой вопрос, то подскажите, где почитать - поиск по сайту не дал результатов(
Проблема решена! Скачала из другого источника MyHomeLib, инсталлировала без проблем. папку с программой из архива снесла. После этого все завелось Smile
Удалять сообщения не буду, вдруг кому-то пригодится!

agent4707

Здравствуйте! В INPX нет архива за июнь 2023

AlexVPetrov

agent4707 писал(а):

Здравствуйте! В INPX нет архива за июнь 2023
За июнь ещё нету.

lesss

Crystal писал(а):

Следующее обновление - вероятнее всего, в сентябре.
А кому очень хочется, берёте вот здесь файл архива книг: https://booktracker.org/viewtopic.php?t=99725
А вот здесь файл inpx (читайте инструкцию): https://booktracker.org/viewtopic.php?t=64690
И обновляете свою библиотеку.

slade60

lesss писал(а):

Crystal писал(а):

Следующее обновление - вероятнее всего, в сентябре.
А кому очень хочется, берёте вот здесь файл архива книг: https://booktracker.org/viewtopic.php?t=99725
А вот здесь файл inpx (читайте инструкцию): https://booktracker.org/viewtopic.php?t=64690
И обновляете свою библиотеку.
Спасибо большое за ссылки!

iso9660

Я же правильно понимаю что можно и без inpx, положить файл в дирку и провести полное сканирование коллекции?
Просто дольше будет.

lesss писал(а):

Crystal писал(а):

Следующее обновление - вероятнее всего, в сентябре.
А кому очень хочется, берёте вот здесь файл архива книг: https://booktracker.org/viewtopic.php?t=99725
А вот здесь файл inpx (читайте инструкцию): https://booktracker.org/viewtopic.php?t=64690
И обновляете свою библиотеку.

Hibor

iso9660 писал(а):

Я же правильно понимаю что можно и без inpx, положить файл в дирку и провести полное сканирование коллекции?
Просто дольше будет.
Не совсем. Результат разный.
В вашем варианте инфа о новых книгах бужет выдираться из книг, т.е. то что туда вложили создатели файлов.
Там зачастую очень криво заполнено, а вот inpx в большинстве создаются на основе дампа библиотеки (Флибусты), т.е. включают в себя все правки пользователей библиотеки на соотв. дату - разница очень заметна, особенно на большой дистанции, больше месяца.
Вообщем подсунуть несколько десятков книг с "ежедневок" можно и с функции скана, а добавлять большие объемы для коллекции лучше все же с правками из БД (inpx, хотя бы и такой кастомный как предложен по сссылке выше. впрочем никто не запрещает создать свой близкий к здешнему)

iso9660

А можно чуть подробнее?
По результатам правок пользователей библиотеки, информация в книгах меняется? Или книгу как создали так она и существует, не меняясь?

Кто и где берет эти самые "дампы библиотеки" для создания inpx? И что они собой представляют?

Hibor писал(а):

iso9660 писал(а):

Я же правильно понимаю что можно и без inpx, положить файл в дирку и провести полное сканирование коллекции?
Просто дольше будет.
Не совсем. Результат разный.
В вашем варианте инфа о новых книгах бужет выдираться из книг, т.е. то что туда вложили создатели файлов.
Там зачастую очень криво заполнено, а вот inpx в большинстве создаются на основе дампа библиотеки (Флибусты), т.е. включают в себя все правки пользователей библиотеки на соотв. дату - разница очень заметна, особенно на большой дистанции, больше месяца.
Вообщем подсунуть несколько десятков книг с "ежедневок" можно и с функции скана, а добавлять большие объемы для коллекции лучше все же с правками из БД (inpx, хотя бы и такой кастомный как предложен по сссылке выше. впрочем никто не запрещает создать свой близкий к здешнему)

Hibor

iso9660 писал(а):

А можно чуть подробнее?
По результатам правок пользователей библиотеки, информация в книгах меняется? Или книгу как создали так она и существует, не меняясь?
Кто и где берет эти самые "дампы библиотеки" для создания inpx? И что они собой представляют?
ок, вот смотрите:
* есть автор книги - он ни при чем Smile с него текст для скана
* есть автор fb2-файла книги, тот кто отсканировал, вычитал как смог, оформил в fb2 и залил в библиотеку
вопрос о качестве скана/вычитки отбросим, но при оформлении fb2 заполняются внутри файла мета-данные - название, серия и №, авторы (ФИО), издательская инфа и т.д. (посмотреть можно в гугле по "формат fictionbook")
вот на этом этапе (заполнение полей) идет куча косяков - кто-то сам не понимает формат, кто-то не различает имя и фамилию (не так редко как кажется), кто вместо авторской серии "Королевство NNN" книга #3 прописывает издательскую вроде "Фантастические миры" (соотв. не надешь полную серию) плюс разное написание сложных имен и просто орфографические ошибки
* все это изначально попадает в библиотеку при залитии
* после пользователи заходят и правят (и эти правки в разгромном большинстве в плюс относительно оригинала) - приводят в порядок, НО! все правки сохраняются в базе библиотеки, файлы книг неизменны
* потому в подобных раздачах идут архивы с оригинальными книгами (как изначально залили) и inpx - таблицы сгенерированные с базы библиотеки с правленными данными
* дампы для генерации inpx берут с сайта библиотеки, а данном случае сгружают в дату последнего обновления с http://flibusta.is/sql/ (обновление раз в день, нужны те что в начале, подзаголовок "Таблицы" кроме lib.librecs.sql.gz). дампы - это sql-ки таблиц базы. всем занимается соответственно автор раздачи
* можно если навык есть генерировать самому (и вносить полезные изменения), а можно воспользоваться наиболее известной утилиткой https://github.com/rupor-github/InpxCreator (в целом стандарт для раздач)
качаем утилитку, дампы на дату последнего обновления книг и

Код:

lib2inpx.exe --read-fb2=all --prefer-fb2=complement --quick-fix --clean-when-done --archives=%ARCPATH% %DUMPPATH%
где -read-fb2=all - зачитываем из файла-книги если отсутствует запись в БД (вообщем-то это чуть полных дублей, но пусть)
-prefer-fb2=complement - если серия не указана в БД забираем из файла, сам использую =ignore - игнорировать, ведь если нет в БД знач ее спецом в библиотеке стерли
--archives=%ARCPATH% - %ARCPATH% это директория с архивами книг
%DUMPPATH% - директория с распакованными sql-файлами дампа Флибусты
после долгой отработки (он по всем файлам проходит, можно значительно ускорить без зачитки fb2 - смотрите опции утилиты) в директории "data" получим нужный inpx
* кстати, обновлять свою коллекцию можно и самостоятельно - там же в http://flibusta.is/daily/ качаются ежедневные обновления, которые собираются в общий месячник и добавляются в раздачу - можно и самому заниматься, хоть каждый день, только inpx часто обновлять накладно

wowan_zh

Hibor
Спасибо за адрес ежедневных обновлений! Вот только где взять недостающее? За июнь месяц выложен файл f.fb2-734724-739321.zip, а скачал по ссылке с номера 740997.fb2. 676 книг отсутствует... Мне нужны для моей раздачи, накапливая для будущего обновления:
https://booktracker.org/viewtopic.php?t=97608&spmode=full#seeders
В другой моей раздаче https://booktracker.org/viewtopic.php?t=97460&spmode=full#seeders устраивают месячные архивы.

Hibor

wowan_zh писал(а):

Спасибо за адрес ежедневных обновлений! Вот только где взять недостающее? За июнь месяц выложен файл f.fb2-734724-739321.zip, а скачал по ссылке с номера 740997.fb2. 676 книг отсутствует...
Они циклично стираются-пишутся новые, так что следить надо и качать пока есть.
Для ежедневок нет четкого графика удаления архивов, примерно за три дня лежат.

В нете я не находил кто бы хранил и раздавал оригинальные ежедневки Флибусты, кроме как Crystal здесь,
так что раз момент упущен - единственный вариант дождаться здесь новый месячник от yanusbeda в начале августа (FB2+USR раздачи, пока Crystal в отпуске он месячник fb2 обновляет, впрочем как и свою раздачу откуда тож можно забрать архив), а дальше уж нормально самим качать-обновлять.

В этом и состоит подвиг Crystal и yanusbeda - десятилетие хоть и автоматизированно, но в обязательном порядке качать ежедневки Up

p.s. если ждать две недели совсем никак - могу подсказать:
такая выкачка не поощряется, но тут дистанция короткая, не вся библиотека, так что
1. качаете по ссылке выше таблицу lib.libbook.sql.gz и импортируете в любую БД для работы
2.1 выдираете строки с BookId нужного вам диапазона (чего не хватает)
2.2 из получившегося списка делаете выборку только fb2 (фильтр по FileType) и только поле BookID
2.3 в списке-результате BookId превращаете в ссылки вида "https://flibusta.is/b/NNNNNN/fb2" где NNNNNN - BookID
3. список ссылок кидаете в любой менеджер закачек, ставите ограничение - забирать по одной и качаете
4. получаете кучу файлов вида "транслит автор - транслит название.NNNNNN.fb2.zip"
5. распаковываете, любым более менее функциональным менеджером файлов переименовываете в "оставить 6 цифр.fb2" (рег.выражениями) и запаковываете куда вам нужно
пункты 2.1-2.3 делаются одним запросом, тут просто расписал что б понятнее было
дела, кроме самой закачки, на минут 5 макс

в таком алгоритме два минуса:
1) нет сохранения разбивки по оригинальным архивам-ежедневкам - ерунда, нам же не они сами нужны
2) серьезнее - не все книги возможно выкачать с сайта:
a) хоть это и пиратская библиотека некоторые книги нельзя скачать с сайта "по требованию правообладателя" ai - в этом месяце такая одна была, какая-то 1а из англоязычных (не помню уж) - они только через Tor-версию сайта доступны, ну и в оригинальных архивах
b) некоторые книги по структуре битые - открываются, читаются и исправляются влегкую, но вот закачка через сайт с чего-то при выдаче лезет в них и глючит - в этом месяце таких было три (что-то из любовно-фантастических романов). править сайт давным давно уже никто не торопится, можно не надеятся

вообщем, вывод - проще подождать нового месячника и там уж беспроблемно качать ежедневки Smile
кстати, если не вкурсе, не смотря что архивов ежедневок в день 1-4, они все выкладываются в ~ 5:08-5:10 по Москве, тогда же генерится дамп базы - оборудование старое и опытным путем получено что лучше начинать качать не раньше минут 20 иначе можно встрять с запоротыми пустыми дампами за текущий день для всех, что прям скажем неприятно на стыке месяцев

wowan_zh

Hibor
Нет такой проблемы ожидания 2_х недель, обычно я использовал ежедневные обновления для выявления дубликатов в еженедельных обновлениях Либрусек с помощью программы CloneSpy. Приходится ожидать месячных архивов Флибусты, чтобы произвести сравнение по CRC_суммам. Обычно в месяц из Либрусек удаляются от 500 до 1000 книг_дубликатов. Либрусек - мерзкая библиотека, количество файлов в недельных обновлениях в месяц всегда меньше числа книг, помещаемых в архив, но самое гадкое, что все книги в архиве подвергаются редактированию (редактируют коды жанров), часть из которых позднее попадают в недельные обновления, и соответственно эти книги после редактирования меняют размер и CRC_суммы, попадая в повторы, которые вручную приходится удалять для накопительного обновления своей раздачи. Вообще то Флибуста=Либрусек+20%. За семь моих последних раздач выложено 19197 книг, из них книг Либрусек только 349 (Маловато будет! Ма-ла-ва-та), что составляет 2,15%, причем значительная часть этих книг заменила существующие из-за лучшего качества (наличие обложки, бОльшее количество страниц).
Ждем возвращения Crystal из "домика в деревне"!!! ag
Показать сообщения:    
Ответить на тему