Loading...
Error

inpx для библиотеки LibRusEc "расширенный" (сортированный список) от 06.05.2017

Страницы:  1, 2  След.

Ответить на тему

 | 

 
Автор Сообщение

Drunkenmunky

Статистика:
Lib.rus.ec Offline May 6, 2017
Total: 522316(fb2: 386849 + usr: 135467) books
Описание:
.inpx - индексный файл для импорта\экспорта информации между базами данных каталогизаторов MyHomeLib или freeLib и библиотекой Либрусек

Инструкция по обновлению:
  Экспортировать пользовательские данные (Коллекция>Экспорт>Пользовательские данные)
Удалить старую коллекцию (лучше просто отключить - на всякий случай)
Создать новую коллекцию, указав путь к новому .inpx
Импортировать пользовательские данные (Коллекция>Импорт>Пользовательские данные)

О создании только FB2 и USR коллекций, или других выборок используя этот INPX:
  Файл INPX - это переименованный ZIP архив содержащий текстовые таблицы в формате похожем на таблицы OpenOffice.
При необходимости, можно спокойно удалять из него всё ненужное с расширением .inp, ориентируясь по префиксам в именах файлов.
Файлы с расширением .info удалять не следует.
После создания коллекции сам файл INPX можно удалить тоже.

Ориентируясь по именам файлов .inp вы можете удалять "ненужное". Формируя максимально удобную по вашему мнению коллекцию (или несколько коллекций).
Файлы сортируются по признакам:
1. Принадлежность к архиву FB2 или USR.
2. Язык(более ста записей в базе, иначе помещается в файл с префиксом other или empty)
3. "Удален" или нет из базы. Если да, то помечается как -del-, если нет, то как -ok-
4. Жанр. Сортируется по метажанрам. Если метажанров несколько, то эта часть имени образуется из их списка, с сортировкой по алфавиту и удалением повторов. Смотри прилагаемую таблицу метажанров, для сведения. Метажанры также добавляются в ключевые слова.

Если в базе данных для книги жанр не указан, то она помещается в файл с окончанием -empty.
Если же книга вообще не упоминается в базе данных, то её описание помещается в файл с частью имени -BDexcluded- (например fb2-BDexluded-books.inp) Таких файлов может быть несколько. В "ключевые слова" записи inp этой книги добавляется тег excluded
Пример.
В файле usr-ru-del-det-sf.inp содержатся индексы файлов из архивов с префиксом usr-.
На русском языке, помеченные в базе данных как "удаленные" из поиска. Детективого и одновременно фантастического жанра.

О сериалах.
  Найден способ обойти баг MHL с "многосерийностью" некоторых книг. Путем дублирования записей с занесением отдельного сериала в каждую из них.
Естественно, это увеличило количество записей(статистика MHL будет показывать большее количество книг), кроме того при импорте на устройство существует вероятность дублирования файлов(в разных сериях будет содержаться один и тот же файл).
Некоторое количество сериалов имеют древовидную структуру. В этом случае "родительские" серии отделяются от "дочерних"двойным слэшем.
И наконец, в базе Либрусека имеются два типа сериалов - авторские и издательские. Помечаются [a] и [p] соответственно.
Пример: Серия "Ходячие мертвецы//Губернатор[a]"
При этом родительская серия будет добавлена отдельно(если содержит книги) так как MHL древовидную структуру не поддерживает.
То есть в приведенном примере Ходячие мертвецы//Губернатор[a] и Ходячие мертвецы[a] это разные серии.

Книги имеющие в базе языковый код производный от "ru"(кг, ру и т.д.) в inp файлах приводятся к единому коду "ru".
Книги имеющие в базе языковый код производный от "uk"(ua) в inp файлах приводятся к единому коду "uk".
Книги не имеющие в базе языкового кода помещаются в файл с пометкой -empty- (как правило, они на русском языке)
Для архивированных не-fb2 файлов к названию книги в скобках добавляется их истинное расширение.
Название книги формируется путем объединения данных из ячеек Title и Title1(если не пустая, заключается в квадратные скобки) из базы данных.

Примечание:
  Файл создавался альтернативным lib2inpx-win32 способом и софтом. Возможны ошибки.
О которых просьба сообщать в комментариях.
Тестировалось на MyHomeLib 2.2.0.822

В помощь пользователю прилагается небольшой bat файл удаляющий из inpx всё лишнее в один клик.

Архивы с которыми совместим этот INPX:
FB2 выборка здесь
USR часть до №88 здесь
Остальное выкладывается здесь.
Файлы "заплаток" брать тоже.

P.S. Некоторые нововведения.

  Добавлен файл "archives.info" со списком проиндексированных архивов.

  Файлы -BDout- с порядковым номером сведены в один и переименованы в -BDexcluded-. В "ключевые слова" включенных в них книг добавляется тэг "excluded" для их поиска по коллекции.

  . Метажанры теперь добавляются в "ключевые слова". Возможно, покажется удобным. Экспериментальным путем показано, что поиск по метажанру в ключевых словах дает более полный результат, чем поиск по корневому(родительскому) жанру.

  Таблица метажанров обновлена, так как на Либрусеке добавили жанров. Возможны какие-то перестановки (не вникал, смотрите сами).

  Выявлено больше трехсот "подмен"*- частично перемещены в -BDexcluded- (информацию удалось извлечь из INPX 13-14-го годов, в том числе от Флибусты, лежащих на трекере. Несколько десятков,в основном из USR, не определено - вероятно были исключены сильно ранее. Выборочный просмотр показал их незначительную ценность).
*Под подменой имеется в виду присвоение ID ранее исключенной из базы книги другой книге(или её "карточке").
Download
Для скачивания .torrent файлов необходима регистрация
Сайт не распространяет и не хранит электронные версии произведений, а лишь предоставляет доступ к создаваемому пользователями каталогу ссылок на торрент-файлы, которые содержат только списки хеш-сумм

Tuffchik

Большое СПАСИБО!!! ay Beer 2

ArYrI

спасибо тебе добрый человек от всех жителей Гондураса

control52

Огромное спасибо! Ваш труд неоценим.

Великий Лух

Спасибо огромное! ОЧЕНЬ выручили!

vfibybcn

Не знаю почему, но никак не получается самому создать .inpx с новыми архивами. Выскакивает ошибка.

Drunkenmunky

vfibybcn писал(а):

не получается самому создать .inpx с новыми архивами. Выскакивает ошибка.
Какие конкретно архивы имеются в виду?
Хотелось бы подробней об ошибке.

Если речь об usr- "заплатках", то это вполне вероятно.
Первые три usr-***-***_lost.zip архива имеют имена файлов в формате "bid.ext", а не "транслит_Title.ext" как, возможно, ожидалось.
Очень может быть, что стандартная программа на них спотыкается. Я с ней архивы не тестировал.
Попробуйте эти три архива переименовать, увеличив bid'ы в имени архивов на 200000.
Что касается остального...
Ждем скрины.

vfibybcn

Drunkenmunky
FB 2 № 98. Я этот архив переименовываю в inp и добавляю его в последний inpx . Отключаю существующую коллекцию, создаю новую с inpx, в который я добавил fb 2 № 98 и в конце создания новой коллекции выскакивает ошибка.

Drunkenmunky

vfibybcn писал(а):

Drunkenmunky
FB 2 № 98. Я этот архив переименовываю в inp и добавляю его в последний inpx .
А раньше такое действие как проходило?

vfibybcn

Раньше я это не делал. Сейчас у Вас почитал и решил попробовать. Но не получилось.

Drunkenmunky

Хорошо. Давайте по порядку. Пошагово.
Я правильно понимаю, вы хотите сделать коллекцию содержащую только fb2 книги?

Sashka_1959

Drunkenmunky
Здравствуйте!
Скажите пожалуйста, файл INPX на сегодня 17.12.2016 18:30МВ в этой раздаче учитывает обновление №98 от 17.12.2016 от SlalomJohn(вот эта раздача viewtopic.php?t=1198).
Что то я запутался.
Не сердитесь за вопрос.
Большое спасибо за ответ.

Drunkenmunky

Sashka_1959 писал(а):

файл INPX на сегодня 17.12.2016 18:30МВ в этой раздаче учитывает обновление №98 от 17.12.2016 от SlalomJohn(вот эта раздача viewtopic.php?t=1198).
Пока нет.
Чуть позже добавлю в раздачу еще один INPX для коллекций с обновленным архивом.
До следующего обновления их будет две версии. Потом INPX буду делать только для последнего.
Ничего страшного - мудацкие поступки релизеров fb2-выборок не новость.

Drunkenmunky

Раздача обновлена. Читайте "примечание" в описании.

Sashka_1959

Drunkenmunky
Здравствуйте!
Извините еще раз за уточняющий вопрос. "Чукча не писатель..." ab
Какое из обновлений №98 будет использоваться в дальнейшем, Ваше или SlalomJohn, еще не решено?
Решение откладывается до появления обновления №99?
Спасибо за терпение и ответ!
Показать сообщения:    
Ответить на тему