Loading...
Error

Корректировка №2 и дополнение №2 к библиотека FIDONET по состоянию на 5 декабря 2010г

Ответить на тему

 | 

 
Автор Сообщение

gav-m

Корректировка №2 и дополнение №2 к библиотека FIDONET по состоянию на 5 декабря 2010г (1896 файлов)

Количество файлов: 1896
Обьем файлов: 1,2 Gib
Количество авторов: 1178
Жанров:176
Формат: TXT, DJVU, FB2

Корректировка исправляет неверно указаный жанр для 93 книг.
Дополнение добавляет в библиотеку 1896 книг, доводя ее до состояния на 5 декабря 2010г. Обращаю внимание, что дата указана по моей локальной базе. Всвязи с особенностями функционирования сети FIDONET любое состояние конференций локально для узла, состояние источников нельзя сравнивать напрямую.


Список добавленых книг в корне раздачи, файл files.2.bbs.txt, либо http://tinyurl.com/36guyp2

Другие новые файлы в корне раздачи:
  • index.htm class.htm titles.htm - дополнение к html оболочке библиотеки, добавлены выбор по жанру и по названиям книг, стартовая страничка index.htm.
  • files.2.bbs список новых файлов, включенных в дополнение 2, кодировка cp866/DOS


Порядок работы с исправлением и дополнением
  • Распаковываем все архивы в дереве раздачи за один проход (оставляя извлеченые архивы) в каталоги с именами, совпадающими с названиями архивов. Два варианта:

    Вручную: Пройдясь по всему дереву каталогов, для каждого архива в контекстном меню проводника (по правому клику на файл архива) выбрать "Extract to имя_архива\", появившиеся при этом подкаталоги не просматривать, архивы в них не распаковывать

    Командным файлом extract.bat: Запускаем файл extract.bat в корне каталога куда были скачаны файлы Важно:Для корректной работы батника нужно при необходимости изменить путь до архиватора rar/unrar во второй строчке этого файла. По-умолчанию считается, что архиватор называется rar и путь до него присутствует в переменной окружения PATH. Исправьте, если не так
    Внимание:После выполнения файла extract.bat исходные архивы будут удалены! Сохраните их заранее, если они вам нужны

  • Копируем каталог Patch2 в корень библиотеки, заходим в него и запускаем patch2.bat.
  • Копируем все остальные файлы и каталоги в корень библиотеки, соглашаясь на замену уже существующих файлов


Отказ от ответственности: автор раздачи слагает с себя всякую ответственность за то что следование вышепреведенным инструкциям и выполнение вложенных командных файлов приведет в любом случае к ожидаемому результату. Наилучшей практикой является создание резервной копии всех данных, которые Вы считаете важными для себя, перед выполнением любых операций за корректность которых не ручаетесь Вы лично.
Download
Для скачивания .torrent файлов необходима регистрация
Сайт не распространяет и не хранит электронные версии произведений, а лишь предоставляет доступ к создаваемому пользователями каталогу ссылок на торрент-файлы, которые содержат только списки хеш-сумм

Michel-F

Спасибо за раздачу!

В дополнение выкладываю inpx-файл БД коллекции FidoLibrary, необходимый для её корректного подключения к MyHomeLib.
http://rapidshare.com/files/436419148/FidoLib_gavm_..._-_update_2.inpx

Файл: FidoLib_gavm_edition - update 2.inpx
CRC-32: c5e9b81e
MD4: 9a2865488a02e90a4a2f6300e68df306
MD5: 4ed4a5b11056a0c6f85bec7b07b06771
SHA-1: 633d5184f83710f87160dc1abd7840c165a45b49

Особенности подключения библиотеки в MyHomeLib (ВАЖНО! прочесть перед установкой inpx):

Цитата:

Краткая инструкция по установке БД Fido Library
-----------------------------------------------

Работа с коллекцией FidoLibary через программу MyHomeLib имеет ряд особенностей.

1. Жанры библиотеки отличаются от списка жанров для fb2, в исходном варианте MyHomeLib все жанры будут загружены в раздел "Другое".
Для корректной загрузки жанров до запуска программы необходимо заменить файл genres_fb2.glst на файл из архива Genres_MyHomeLib.zip.
После загрузки БД из inpx-файла файл genres_fb2.glst нужно заменить на оригинальный, для дальнейшей работы изменённый файл жанров не нужен.
(также приложен в архиве; инструкцию по импорту из inpx-файла смотрите на сайте программы).
2. MyHomeLib не поддерживает работу с рар-архивами, необходимо настроить их открытие в архиваторе WinRAR или 7-Zip.
3. Кодировка большинства текстовых файлов в архивах - cp866 (кодировка DOS), современные программы просмотра не всегда работают с ней корректно.
Для просмотра рекомендую использовать CoolReader (приложен в соответствующем архиве) и настроить его как внешний просмотрщик в WinRAR
(вызывается по Alt-V), либо настроить CoolReader как программу для просмотра txt-файлов по умолчанию
(не рекомендую, но не всегда получается настроить CoolReader как внешний просмотрщик).

Приятного чтения!
Пожелания и дополнения по подключению БД и работе с коллекцией приветствуются.
З.Ы. Коллекция должна быть распакована по инструкции из шапки раздачи.

Alex1

Michel-F
По ссылке открывается страница закачки на рапиду, а не скачивания с нее.

gav-m

Alex1 писал(а):

Michel-F
По ссылке открывается страница закачки на рапиду, а не скачивания с нее.
Нажал кнопку - все скачалось. На всякий случай скопировал сюда: http://tinyurl.com/3y9h72k

Alex1

Может зависит от браузера? Захожу через IE открывается страница upload. Со второй ссылки скачалось без проблем.

Alex1

Michel-F
В inp для 1.2 нашел несколько ошибок.
1.ФИО:
"Томан,Николай Владимирович,:" вместо "Томан,Николай,Владимирович:"
"Ардаматский,Василий Иванович,:" вместо "Ардаматский,Василий,Иванович:"
и т.п.
В первых вариантах Имя и Отчество обрабатываются как имя. Отчество отсутствует.
"Сад,маркиз Де," вместо "Де Сад,маркиз,"

2.Много обрезанных названий.
"ИНФОРМАЦИОННЫЙ ЛИСТОК УКРАИНСКОЙ ФАНТАСТИКИ N 6/2007 (2"

3.Нет категорий, напр. "bookz\Художественная проза (ББК 84)\Отечественная фэнтези\Ужастик (вампиры, оборотни)"
ошибка пришла из файла genres_fb2.glst

строчки
F.01.05.07 [1.05.07];Пришельцы (наши в их мире и наоборот)
F.01.05.08 [1.05.07];Ужастик (вампиры, оборотни)
F.01.05.09 [1.05.08];Юмористическое фэнтези

исправить на
F.01.05.07 [1.05.07];Пришельцы (наши в их мире и наоборот)
F.01.05.08 [1.05.08];Ужастик (вампиры, оборотни)
F.01.05.09 [1.05.09];Юмористическое фэнтези

также
F.01.06.11 [1.06.11];Историческое фэнтези
F.01.06.12 [1.06.11];Фэнтезийная бродилка-экшен

исправить на
F.01.06.11 [1.06.11];Историческое фэнтези
F.01.06.12 [1.06.12];Фэнтезийная бродилка-экшен

и еще
F.08.08.04 [8.08.04];Игры, головоломки, ребусы
F.08.08.05 [8.08.06];Туризм, путеводители
F.08.08.06 [8.08.07];Шахматы, шашки
F.08.08.07 [8.08.08];Филателия
F.08.08.08 [8.08.09];Нумизматика

исправить на
F.08.08.04 [8.08.04];Игры, головоломки, ребусы
F.08.08.05 [8.08.05];Туризм, путеводители
F.08.08.06 [8.08.06];Шахматы, шашки
F.08.08.07 [8.08.07];Филателия
F.08.08.08 [8.08.08];Нумизматика

В inpx по старому. После исправлений в genres_fb2.glst придется переделать и FidoLib_gavm_edition_-_update_2.inpx

4.Остались и разорванные названия журналов
"жизнь' Журнал 'Наука и"
"жизнь' Журнал 'Химия и"

5. Остались в названиях скобки с дублями жанров

Сейчас переделываю, что могу. Если интересно, поделюсь результатом

gav-m

Alex1 писал(а):

2.Много обрезанных названий.
"ИНФОРМАЦИОННЫЙ ЛИСТОК УКРАИНСКОЙ ФАНТАСТИКИ N 6/2007 (2"
Вот так название выглядит в оригинале: "ИНФОРМАЦИОННЫЙ ЛИСТОК УКРАИНСКОЙ ФАНТАСТИКИ N 6/2007 (2". Ограничение на длину поля идет с тех стародавних времен когда дискеты были пятидюймовыми, а 640K памяти хватало на всё.

Alex1 писал(а):

5. Остались в названиях скобки с дублями жанров
Если речь идет о [D.DD.DD] в названиях, мы эту тему уже обсуждали и я волевым решением решил почистить поле "название книги" от этих дублей. Начиная с третьего апдейта, они будут появляться только у новых книг, попавших в базу после последней чистки.

Alex1

gav-m
Да, речь об этом. Как я понял, Michel-F собирался посмотреть и убрать их в inp для 1.2. Предыдущий вариант не рассматривал настолько подробно, поэтому не знаю, были ли там такие проблемы.

Обрезанное название (одно-два) смотрел в bbs файле. Кажется, там оно полностью.

gav-m

Alex1 писал(а):

gav-m
Обрезанное название (одно-два) смотрел в bbs файле. Кажется, там оно полностью.
Да. Ибо files.bbs формируется из File_id.diz архива. Здесь нет ограничений на длину, но свои причуды. Например, длительное время отсутсвие четкой спецификации, вследствии чего парсить этот файл - весёлая проблема. В любом случае, назначение file_id.diz - описание файла а не книги (которых в этом файле может быть >1). Для files.bbs подходит, для книжной базы - нет.

Michel-F

Alex1, gav-m
Во первых словах - с Новым годом! С некоторой задержкой, правда, но праздник есть праздник )

По обозначенным проблемам - всплыла сейчас другая работа, так что доработка парсера имён inpx для фидошной библиотеки несколько откладывается - меня сейчас не устраивает быстродействие генератора inpx в целом, сейчас перевожу его на другой движок БД.
То же самое относится и к "разорванным" названиям журналов. Сделаю, но чуть позже.

Файл genres_fb2.glst, если возможность есть, поправьте и присылайте - я его в своё время формировал вручную, возможно ошибки где-то просочились.
Можете там ещё и названия жанров поправить в соответствии с логикой и здравым смыслом - в перечне жанров MHL они неестественно смотрятся.
Названия жанров - часть строки, что идёт после точки с запятой.

Обрезанные названия - ограничения БД программы FIDO_LIB, там на название не более 50 символов отводилось. Ну и сюда перекочевало, соответственно.
Если gav-m длинные имена сделает в базе, у меня они тоже появятся.
Но парсинг файлов file_id.diz - это та ещё задача, нет там единого формата.

gav-m

Michel-F писал(а):

Обрезанные названия - ограничения БД программы FIDO_LIB, там на название не более 50 символов отводилось. Ну и сюда перекочевало, соответственно.
Если gav-m длинные имена сделает в базе, у меня они тоже появятся.
Но парсинг файлов file_id.diz - это та ещё задача, нет там единого формата.
Глянул я. свыше 13тыс записей где название в file_id.diz длиннее чем в базе. Вот так это выглядит:

Код:

diz:Сергей Афанасьев. Властелин душ Или мир оживших покойников ("Звездный странник" #4)
База:Властелин душ Или мир оживших покойников (Звездный стр
diz:Л.И.Аксельрод "Курс лекчий по историческому материализму"
База:Курс лекций по историческому материализму
Т.Е. в общем случае строка "Название книги" не обязательно является подстрокой file_id.diz. Требуется либо ручная обработка либо очень умный скрипт, распознающий ошибки и разницу в оформлении в разных источниках. Если кто возжелает заняться этим делом, могу выслать либо полные дампы баз названий и diz либо уже отобранные 13 тыс записей где тупой скрипт уже предложил свой вариант, который нужно проверить и исправить по необходимости.
Показать сообщения:    
Ответить на тему