О проекте

Страницы: Пред. 1, 2, 3, 4, 5 След.

Главная » Архивы библиотек » Flibusta rev2.0

Автор	Сообщение
Drunkenmunky	Всё обновил.
	Всё обновил.
Hibor	простите, не понял, а в чем фишка данной раздачи? (относительно fb2-книг) только в перепаковке в книга-архив? какой применен алгоритм убирания дублей/мусора? простое удаление тех что Del=1 в базе? может что-то еще? (касательно fb2) просто для своих книг (fb2 флибусты) я иду более долгим путем, но всеравно куча дублей где разница старый-новый алгоритмически не определима для примера мой подход: 1. перегоняю месячники в вид папка-месячника\отдельные файлы-книги.zip (действительно единственный способ работать с книгами без постоянной перепаковки больших архивов) и подключаю базу Флибусты (sql дампы) 2. авто проход по книгам (проверка xml;пропись данных бд в файл;определение языка; уменьшение extra-large картинок;приемлемая ansi/utf кодировка для совместимости;чистка keywords;пропись в custom инфы с библиотеки (месячник, номер, дата) и др) - тут все что можно автоматизировать для чистки, нормализации и переноса из БД в файл, потом сохранение в Zip-LZMA (MyHomeLib я переделал для поддержки) 3. Проход по таблице Joined в базе, поиск и удаление с винта книг где есть замена (наличие нового файла, в базе нет пометки Del); в список книги те что прописаны как joined с заменой, но старые не помечены как Del (таких не так много, но зато не автоудаляем лишнее), так же в список книги с пометкой Del, но отсутствующие в Joined. Проход по 2ум созданным спискам в MHL (автовыделил их через бд, а потом вручную - толлько по полной базе кажется много, а месячники быстро) 4. генерация нового inpx на основе существующих книг и внесенных изменениях вот с пунктом 3 проблема - по сути здесь то же удаление тех что Del=1 в основной таблице, НО! таким способом остается около >5К ру-книг что помечены как удаленные, но у них нет замены (вручную проверял наличие аналога), из них только около сотни откровенный мусор Это первое, а второе - после всех удалений по оф. базе легко обнаруживаются кучи!!! книг имеющие 2-8 дублей с вариантами: - одинаковые, но тупо не помеченые в базе флибусты ни как Del, ни как Joined - разные версии (напр пишущийся самиздат, или после правок, но без соблюдения id и версии) - разные издания или, как вариант, одно издание, но различные оцифровки (с иллюстрациями/без, разные авторы док-та и т.п.) - "сборники", которые последние годы плодятся... часто бывает лежат норм серия + трилогия+квадрология+ еще пару самодельных логий и т.д. часть всего этого мусор, часть должно быть в библиотеке, но под вопросом в частной коллекции, но главное - все это не автоматизируется утилиты вроде Sharp's Tools (что выводят дубли по автор+тайтл и др варианты) помогают мало, т.к. опять же четкого критерия нет (с id путаница, ни по дате, ни по версии не соориентируешься ч.б. однозначно определять). Я свел оставшуюся чистку к помеченному авто-списку (импорт в MHL) дублей "автор-тайтл- ~размер" +"логии", по которому постепенно прохожу вручную, конечно впервую очередь то что читаю ... Интересует: Какой вариант (алгоритм) чистки дублей применен в этих раздачах? Есть ли что-то действительно качественно новое относительно официала?

Drunkenmunky	Hibor писал(а): Интересует: Какой вариант (алгоритм) чистки дублей применен в этих раздачах? Всё, что в день формирования раздачи помечено в базе как "удалено" удалено. Цитата: Есть ли что-то действительно качественно новое относительно официала? Есть. Раздача, изначально, задумывалась как только не-fb2, с упаковкой в один архив с файлом fbd, и добавлением обложек. По ходу дела добавлена fb2 часть, с возможностью раздачи "выборок". Особенность выборок в том, что можно раздавать разные наборы файлов из одной директории. Что сняло некоторую напряженность в сообществе.

Drunkenmunky	Всё обновил. Добавил выборку "Вся проза" в четырех частях. Кому нужно больше трекеров, их можно скопировать из свойств торрент-файла INPX, все мои раздачи идут через них. Кому неудобно просматривать список раздач в разделе, внизу раздела есть меню выбора "упорядочить по".

Drunkenmunky	Всё обновил.
	Всё обновил.
Drunkenmunky	Очередное обновление, с некоторой задержкой, по причинам технического характера - техника старенькая уже, отказывает иногда. Напоминаю, что если кому-то нужно больше трекеров, их можно скопировать из раздачи INPX, а в следующее обновление основных раздач будут добавлены файлы за 2021 год в отдельные раздачи. За 2020 больше обновляться не будет.

Drunkenmunky	Добавил основные раздачи за 2021 год. Обновил выборки и INPX. P.S. Администрация Флибусты анонсировала некие нововведения в интерфейсе и структуре библиотеки, так, что следующее обновление может быть непростым. А может не быть. Так, что, если что - без паники.

Drunkenmunky	Всё обновил.
	Всё обновил.
Drunkenmunky	Обновление. Подозрительно много книг в выборке ПРОЗА за июль 2021. Раз в пять-шесть больше обычного. Просьба пользователям, в случае обнаружения каких несоответствий, сообщать об этом.

Drunkenmunky	Обновлено
	Обновлено
Drunkenmunky	Всё обновил. Следующее где-то в марте. Добавлю основные за 22 год. И, возможно, еще частей некоторым выборкам. Как минимум фантастике. Торрент генерируется уже долго. Кстати о фантастике. Говорят, жанров добавили. Пишите - что там и как, если что.

Drunkenmunky	Обновил всё. Хоть и с задержкой. По объективным причинам. По поводу следующего. Собираюсь его сделать где-то в мае. Но обстановка этому не способствует. Кому нужны дополнительные трекеры - копируем из INPX. С раздачи не уходим, если у кого есть полные, скачиваем "выборки" и из одной папки раздаем. У кого только выборки, временно завязываем потребл*дством, качаем одну, две, три раздачи, за какой-нибудь год, где нет или мало сидов, можно в отдельные папки, и раздаем. От диска не убудет пока это всё чем-то не закончится. У кого раздачи не идут, даже через дополнительные трекеры, читаем про настройки торрент-клиента через TOR.

Drunkenmunky	Обновление. С раздачей, в связи с нестабильностью, могут быть(и таки бывают) перебои. Не уходите как можно дольше.

Drunkenmunky	Всё обновил. Примечание. С моей стороны никаких ограничений не установлено. Все блокировки, задержки и тд происходят по независящим от меня причинам, и в случае их долговременного характера, следует рассмотреть-таки использование сетей VPN и TOR Ну, или ждать сидирующих из нейтральных стран.

Drunkenmunky	Обновлено. Оставайтесь на раздаче.
	Обновлено. Оставайтесь на раздаче.

Страница 3 из 5

Страницы: Пред. 1, 2, 3, 4, 5 След.

Главная » Архивы библиотек » Flibusta rev2.0

Пользовательское Соглашение | Для правообладателей