Loading...
Error

Библиотека Flibusta (только FB2) на 01.06.2018 (424186 книг) (локальная коллекция, пополняемая ежемесячно) + MyHomeLib + inpx

Страницы:   Пред.  1, 2, 3 ... 114, 115, 116 ... 135, 136, 137  След.

Ответить на тему

 | 

 
Автор Сообщение

Crystal

EgorD
Будет, конечно. Создаётся уже.

Crystal

01.04.2017. Раздача обновлена. Пожалуйста, перекачайте торрент-файл.
Добавлен архив f.fb2-476871-480576.zip. Файл inpx обновлён. Дампы базы данных Флибусты на 01.04.2017 здесь:[url]viewtopic.php?t=73862[/url]
Обновления на Яндекс.Диске: https://yadi.sk/d/A4YHgbtQvzekj

latygiev

и в очередной раз спасибо за ударный самоотверженный труд)

azhur

Crystal
Спасибо за очередное обновление!
С проблемой неправильных серий в inpx не разбирались ещё похоже?
Смотрим свежий апрельский файл f.fb2-476871-480576.inp, 4-я строчка с конца:

Код:

Мзареулов,Константин,:sf_action:sf_space:sf:Экстремальные услугиФантастический боевик19948057314344594805730fb22017-04-01ru
Опять в базу попадает издательская серия "Фантастический боевик".
Предположение о причине такой ошибки в программе-генераторе (какой, кстати?):
1. Тег <sequence ... /> ищется по всему файлу книги (или как минимум по всему тегу <description>), а не только по <title-info>.
2. Если тегов найдено несколько, используются данные из последнего.
3. <publish-info> всегда по схеме идёт после <title-info>.
4. Из пунктов 1-3 следует, что если в файле заполнена издательская серия (<sequence ... /> внутри <publish-info>), то в inp-файл попадёт именно она.

Также есть сомнение, что корректно обрабатывается такая относительно редкая конструкция, как вложенные/сабсерии, типа:

Код:

   <sequence name="Звёздные войны">
    <sequence name="Оригинальная трилогия" number="1"/>
   </sequence>

EgorD

Crysta!l

bi Clap Punk

Во дворе у меня зацвела акация.
Веселится со мной вся моя родня.

....

(поскипано)
...

Наверное музыка навеяла, да.

Crystal

azhur

Простите, а с чего Вы, собственно, решили, что в базу должна попадать авторская, а не издательская серия? И, если уж считать это ошибкой, то почему Вы думаете, что проблема на моей стороне, а не в БД Флибусты, к примеру?
INPX я делаю с помощью Lib2inpx.

UPD. Посмотрел я приведённую Вами для примера книгу в FBE. Вот код описания и служебной информации:
<FictionBook xmlns="http://www.gribuser.ru/xml/fictionbook/2.0" xmlns:l="http://www.w3.org/1999/xlink">
<description>
<title-info>
<genre>sf</genre>
<genre>sf_space</genre>
<genre>sf_action</genre>
<author>
<first-name>Константин</first-name>
<last-name>Мзареулов</last-name>
</author>
<book-title>Экстремальные услуги</book-title>
<annotation>
<p>Двадцать четвертый век… Человечество уже давно вышло за пределы Земли и расселилось по многочисленным планетам. Установлены связи с тремя негуманоидными цивилизациями, однако отношения с ними отнюдь не дружественные. Впрочем, и в отношениях между государствами людей не все гладко. Человек, к сожалению, пока не изменился, есть умные и не очень, благородные и предатели.</p>
<p>Агасфер Кассетов возглавляет небольшую фирму. Его специальность — дыролаз. Он спрямляет и в случае необходимости расширяет трассы для космических кораблей сквозь ЧД — черные дыры. Но у Агасфера есть еще и секретная кличка — Уран… И мало кто знает о его тайной миссии и никто — о его способностях…</p>
</annotation>
<date>2001</date>
<coverpage>
<image l:href="#cover.jpg"/></coverpage>
<lang>ru</lang>
</title-info>
<document-info>
<author>
<first-name>Faiber</first-name>
<last-name></last-name>
<email>faiber@yandex.ru</email>
</author>
<program-used>FB Tools, FictionBook Editor Release 2.6</program-used>
<date value="2017-04-01">01 April 2017</date>
<id>20483</id>
<version>1.1</version>
<history>
<p>v 1.0 — создание fb2 — Faiber</p>
</history>
</document-info>
<publish-info>
<book-name>Константин Мзареулов «Экстремальные услуги»</book-name>
<publisher>Издательство Альфа-книга</publisher>
<city>Москва</city>
<year>2001</year>
<isbn>5-93556-122-0</isbn>
<sequence name="Фантастический боевик" number="199"/>
</publish-info>
<custom-info info-type="">Тираж: 15000 экз.
Страниц: 408
Иллюстрация на обложке и внутренние иллюстрации И. Воронина.</custom-info>
</description>
Где тут хоть какая-то информация о сериях, кроме серии "Фантастический боевик"? Или Вы хотите сказать, что эта книга должна быть вообще вне серий?

Теперь о создании inpx. Если LIb2inpx не указывать ключ --prefer-fb2 merge или --prefer-fb2 replace (чего я никогда и не делал), то информация о серии, содержащаяся в самом файле книги, игнорируется. Используются только данные из SQL-дампов.
Таким образом, Ваш вопрос - не ко мне.

Crystal

Кому интересно, можете попробовать два альтернативных варианта inpx.
По ссылке, приведённой ниже - архив с двумя файлами.

flibusta_fb2_local_merge.inpx - создан с добавлением к обычной команде ключа --prefer-fb2 merge. В этом случае информация о сериях дополняется данными из самой книги (если таковая есть и в книге, и в базе данных). Без этого ключа информация, содержащаяся в самом файле книги, игнорируется.
flibusta_fb2_local_replace.inpx - то же самое, но с ключом --prefer-fb2 replace. В этом случае в inpx попадает информация о сериях только из самого файла книги.

https://yadi.sk/d/SGEh_Waz3GZ6nW

azhur

Crystal писал(а):

azhur Простите, а с чего Вы, собственно, решили, что в базу должна попадать авторская, а не издательская серия?
Потому что во всех программах-библиотеках, которые я видел, "Серия" = авторская серия, из <title-info>. А издательская серия, где она есть, так и названа: "Издательская серия".
И во всех онлайн-библиотеках, которые мне попадались, тот же принцип.
В любом случае, это 2 разных атрибута, а у вас получается смесь "теплого с мягким".

Crystal писал(а):

И, если уж считать это ошибкой, то почему Вы думаете, что проблема на моей стороне, а не в БД Флибусты, к примеру?
На момент написания того поста я не знал, каким способом вы генерируете inpx, опираясь на данные только из самих фалов книг, или на дамп базы флибусты, или на некую смесь этих данных. Предположил, что чисто по данным из файлов, и видимо не угадал.
Вообще, по-моему, проблема может быть в:
1. Неполноте или некорректности данных в файлах книг или базе флибусты.
2. Несовпадении данных из файлов книг и базы.
3. Багах используемого для генерации inpx софта.
По пунктам 1-2 само собой вопрос не к вам, по пункту 3 - если не самописный, то тоже не к вам, а к автору софта.
Максимум, что можно попросить от вас - помочь разобраться в источнике проблемы.

Crystal писал(а):

UPD. Посмотрел я приведённую Вами для примера книгу в FBE.
Где тут хоть какая-то информация о сериях, кроме серии "Фантастический боевик"? Или Вы хотите сказать, что эта книга должна быть вообще вне серий?
Именно! Эта книга ИМХО должна быть вне серий! В дампах флибусты не копался, но на сайте она именно так и отображается: авторская серия - пусто, издано в серии "Фантастический боевик".

Ещё пример несуразицы с сериями:
Юрий Иванович, авторская серия "Невменяемый колдун", 12 книг.
По данным с сайта флибусты (=из базы флибусты, я так думаю ab ):
Всё корректно, авторская серия у всех книг "Невменяемый колдун", издательская: книги 1-7 - "Фантастический боевик", книги 8-10 - "Маги и Герои", книги 11-12 - "Русский фантастический боевик".
По файлам:
1-5,8,10-12 - совпадение с сайтом.
6,7,9 - не указана издательская серия.
По MyHomeLib с inpx из этой раздачи:
Книги 3,6-12 - серия "Невменяемый колдун" (авторская).
Книги 1-2, 4-5 - серия "Фантастический боевик" (издательская).

Вот такая мешанина из авторских и издательских серий меня собственно и побудила написать.

UPD
Crystal, используете эту утилиту?
https://github.com/rupor-github/InpxCreator/releases
Какую версию и с какой командной строкой, если не секрет?

arkadash

Crystal
Большое спасибо. Удачи и терпения... ab

Drunkenmunky

azhur писал(а):

Вот такая мешанина из авторских и издательских серий меня собственно и побудила написать.
Видите ли, Флибуста администрируется энтузиастами. С разным уровнем технической подготовки, и, в отдельных случаях, самобытным внутренним миром. Вот кто-то из них и присвоил атрибут типа серии (не конкретно этой, а вообще) не собственно серии, а непосредственно книге.
В результате чего одна и та же серия может быть и авторской, и издательской одновременно.
Породив тем самым новый тип сериала - "смешанный".

azhur

Drunkenmunky

Цитата:

Вот кто-то из них и присвоил атрибут типа серии (не конкретно этой, а вообще) не собственно серии, а непосредственно книге.
А можете подсказать, как это выглядит в базе (дампе базы) флибусты?
Пока склоняюсь к мысли, что Lib2inpx не знает про какие-то "новшества" в формате базы флибусты, поэтому и получается чехарда с сериями.
Пример 1, в inpx попадает авторская серия, как ИМХО и должно быть:

Код:

lib.libbook.sql
(155412,1860560,'2009-06-28 12:14:17','Жемчужный орден','','ru','','fb2','UTF-8',2008,'0','2.0','MCat78',10571,'','19cb2b96fca5cf25bef74dde11bf4dd6','2017-04-01 18:40:05','4dace90a121e3cb2448c0d016651a876',0)
lib.libseq.sql
(155412,2683,3,1,0)
(155412,2682,0,101,1)
lib.libseqname.sql
(2683,'Невменяемый колдун')
(2682,'Фантастический боевик')
Пример 2, в inpx попадает издательская серия:

Код:

lib.libbook.sql
(353247,2413373,'2014-02-07 16:35:01','Невменяемый колдун','','ru','','fb2','UTF-8',2007,'0','2.1','MCat78',19483,'','5315e003262fd44a8b738b733b69d165','2017-04-01 18:40:05','79aaf4822713667e8d839176e69bd9d5',0)
lib.libseq.sql
(353247,2683,1,1,0)
(353247,2682,467,101,1)
lib.libseqname.sql
(2683,'Невменяемый колдун')
(2682,'Фантастический боевик')
По какому признаку в одном случае выбрана авторская серия, а в другом - издательская, я ещё не понял.

Drunkenmunky

azhur писал(а):

По какому признаку в одном случае выбрана авторская серия, а в другом - издательская, я ещё не понял.
Выдача из базы обработчику подается построчно.
Если строк несколько, то в переменную(если этого не учесть) будет записываться последняя строка.
Вообще-то, (я когда-то просматривал исходный код lib2inpx) это учитывается, более того сам запрос составляется таким образом чтобы выдавался сериал только одного типа, опционально.
Возможно(возможно!) это баг последних версий утилиты.

Crystal

azhur

Цитата:

Какую версию и с какой командной строкой, если не секрет?
Да, именно эту.
Версия - 8.5, самая свежая на вчерашний день. Более старые отказываются работать, обнаружив отсутствие lib.avtoraliase.sql.
Использую два варианта - для 64-битного Линукса (Mint 18) и для 64-битной же Винды.
Результат работы обоих примерно одинаков.

azhur

Только что обнаружил ещё более забавную вещь:
Была у меня в MyHomeLib подгружена коллекция из этой раздачи от 1 марта.
Докачалась актуальная версия от 1 апреля, подгрузил её в отдельную коллекцию.
В результате заметил, что некоторые ранее упомянутые книги перелетели из одной серии в другую.
Например книга с номером 155412 Иванович "Жемчужный орден" в мартовской коллекции числится в серии "Невменяемый колдун" (авторской), а в апрельской коллекции - в "Фантастический боевик" (издательской).
И такие же изменения ещё по нескольким книгам того же автора.
Если у кого-то сохранился дамп базы флибусты от 1 марта, можно было бы посмотреть, были ли изменения в базе по этим книгам.

Crystal, а виндовая версия у вас в консоль какие-то сообщения выдаёт?
А то скачал, с параметрами вроде бы разобрался, но программа молчит как партизан, хоть и работает.
Даже при запуске с единственным параметром --help не выдаёт ни одной строчки.

Drunkenmunky

azhur писал(а):

Например книга с номером 155412 Иванович "Жемчужный орден" в мартовской коллекции числится в серии "Невменяемый колдун" (авторской), а в апрельской коллекции - в "Фантастический боевик" (издательской).
Это говорит о том, что, как я и предполагал в предыдущем сообщении, записывается только одна строка(случайная) из нескольких полученных из базы.
Бороться с этим, в рамках lib2inpx, сложно. Даже если этот баг устранить, то всё равно остается вероятность, что книга может быть включена в несколько однотипных серий. И из них придется выбирать только одну. Программно это можно будет сделать только в случайном порядке.
Конечно количество таких книг будет сильно меньше, но мириться с этим будет непросто.
Исходя именно из таких соображений я в "расширенный" INPX заношу вообще все доступные серии.
Показать сообщения:    
Ответить на тему