Loading...
Error

Дополнение №42 и корректировка №37 к библиотеке FIDONET до состояния на 1 мая 2016г

Страницы:   Пред.  1, 2, 3, 4, 5, 6, 7  След.

Ответить на тему

 | 

 
Автор Сообщение

Krutass

угу... 70-80% электронных не-fb2 книг(научно-технических, для беллетристики не актуально) имеют УДК/ББК.
По времени, (MyHomeLib) забить в базу Автора и Название - 3-4 секунды, жанр по номеру УДК/ББК (открыть книгу - найти номер - открыть дерево жанров- найти номер) - 5-20 секунд

Drunkenmunky

Цитата:

забить в базу Автора и Название - 3-4 секунды, жанр по номеру УДК/ББК (открыть книгу - найти номер - открыть дерево жанров) - 5-20 секунд
Предлагаю ускорить.
В MHL можно включить отображение BookID.
Создаете эксель таблицу с двумя колонками.
Слева BookID, справа УДК/ББК.
Как закончите, я переработаю скрипт с учетом этой таблицы.

Krutass

Drunkenmunky писал(а):

Цитата:

забить в базу Автора и Название - 3-4 секунды, жанр по номеру УДК/ББК (открыть книгу - найти номер - открыть дерево жанров) - 5-20 секунд
Предлагаю ускорить.
В MHL можно включить отображение BookID.
Создаете эксель таблицу с двумя колонками.
Слева BookID, справа УДК/ББК.
Как закончите, я переработаю скрипт с учетом этой таблицы.
Хмм.. а где брать BookID ? После создании своей библиотеки оно пустое. Имеется ввиду ISBN?
Ага... BookID имеет смысл для Либрусека(6-ое "FILE" и 8-ое"LIBID" поля inp-файла), в Пользовательской Библиотеке оно пустое. ac
Похоже, что Для Либрусека BookID, (он же LIBID в inp-файле) это идентификатор книги в Базе, по факту - её номер книги в Архиве...
Получается, чтобы преобразовать наш INPX в "Либрусековский", надо записать в 8-е поле "LIBID" номер книги в Базе, который должен совпасть с её номером в Архиве?
т.е. при переходе в Либрускковский формат придется отказаться от Автора в названии файла, и перейти на номера, продублировав 6-ое "FILE"[/s] и 8-ое"LIBID" поля inp-файла?
Но ведь у Траума-то Автор в названии остался... хотя у Траума другая структура INPX, и поле "LIBID" на 6-й позиции в inp-файле... Но Траум и раздается одним iso-архивом, пополнений нет (как у Либрусека)
Получается, что в режиме Пользователя MyHomeLib если и создает BookID(он же "LIBID"), то не показывает его...
мда...

Drunkenmunky

Опять вы спешите с выводами.
В выложенном выше INPX есть bookid.
Чтобы его отобразить в MHL, в окне списка с книгами наведите курсор на его заголовок.
Из выпавшего списка поставьте галочку в пункте BookID.
Кроме того.
Специально для вас, после того как закончу с INPX, сделаю экселевскую таблицу
название:папка:файл:BookID: и две пустых колонки

gav-m

Ну вы и расписались, однако! Я ни чего не понял 8-] Как понимаю, готовится новая редакция научно-технической библиотеки?

regidrer

gav-m
Не совсем новая редакция Homelab, а попытка создания удобной для использования оболочки.

Krutass

Так, с ББК все...
Дополнил genres_fb2.glst и genres_nonfb2.glst базой ББК(2186 записей) отсюда
http://www.altspu.ru/Res/Handbook/glossary.phtml?gl...0%B0%D1%80%D1%8F
Можно забить туда и весь УДК(10000 записей), «рыба» для УДК там уже сделана.
Проверил, с Библиотекой Либрусека не конфликтует
https://yadi.sk/d/I-fc9CRvsR5GY
Но вот со структурой Библиотеки ясности, увы нет...
Я правильно понимаю, что если библиотеку делать пополняемой zip-архивами(как у Либрусека/Флибусты), тогда надо делать "номерную" систему, как у Либрусека (имя файла заменяется на номер в Базе)?
т.е. без MyHomeLib и INPX библиотека превращается в хлам?
В первых архивах, (usr-139392-142502.zip) впрочем, имена файлов на латинице с нижним слешем типа _Wizards_of_the_Coast_Best_of_Dragon_Magazine_Volume_1.pdf
что тоже не айс...
Если при пополняемой библиотеки без номеров не обойтись, почему бы вместо замены имени файла на номер BookID, просто засунуть файл книгу в папку с этим BookID-номером?
Было "Лем Станислав Солярис.pdf" , стало "\234453\ Лем Станислав Солярис.pdf" ... для каждой книги - своя папка с номеров BookID
...и волки сыты и овцы целы.... ab
В библиотеке Траума, кстати каждый файл упрятан в персональный архив, но имя архива это не номер BookID имя архива совпадает с именем файла... Поэтому библиотека Траума НЕпополняемая, раздается в ISO-образе с поиском книги не по BookID (как у Либрусека) а по пути файла в iso-образе (9-е поле строки в inp-файле) ...

Drunkenmunky

Цитата:

Я правильно понимаю, что если библиотеку делать пополняемой zip-архивами(как у Либрусека/Флибусты), тогда надо делать "номерную" систему, как у Либрусека (имя файла заменяется на номер в Базе)?
Нет.
Если имя файла уникально, как имена не-fb2 файлов в usr-архивах Флибусты, то оно помещается(на Флибусте) в специальную таблицу(lbfilename), где ему присваивается уникальный же ID.
Который соответствует ID в таблице liibook содержащей основную информацию о книге.
Файлы fb2 в таблице libfilename не нуждаются, так как им в качестве имени файла присваивается их ID.
Кроме того, если загружаемый не-fb2 имеется на Либгене(проверяется по md5), то сам файл в таблицу libfilename не помещается, однако информация о нем помещается в libbook. И при попытке скачать его на Флибусте, пытающийся будет перенаправлен на Либген.
Примерно так же работает и Либрусек. Но там свои особенности.

Krutass

regidrer писал(а):

gav-m
рубрики или жанры определять по базам УДК и ББК, для книг советского периода это подходящий вариант, то для современных книг это сомнительно.
Собственно, в этом и смысл - сохранить и систематизировать(для этого и надо ББК/УДК) все, что БЫЛО создано. Народ это в массе понимает, почему и сканируют все подряд, и выкладывает на торренты, пока "наши элиты af " не разнесли страну в хлам, мда... ac
Почему из формата FB2 полностью исключили все существующие классификаторы ББК/УДК/ГРНТИ ?? не осталось места для 6-8 цифр? И второй страницы книги с классификаторами, как правило, нет, если книга выложена в формате FB2(!!). Почему? опять происки "владельцев интеллектуальной собственности"? уже не смешно.
там же не только беллетристика..

Drunkenmunky

Цитата:

Почему из формата FB2 полностью исключили все существующие классификаторы ББК/УДК/ГРНТИ ?? не осталось места для 6-8 цифр? И второй страницы книги с классификаторами, как правило, нет, если книга выложена в формате FB2(
Опять неправильный вывод.
В fb2, в массе своей, хранится художественная литература, у которой не так уж и много жанров.
Сканирование технической литературы сопряжено с тем, что требует тщательной вычитки и правки текста. Так как имеющийся для этого софт весьма некорректно распознаёт формулы, термины, таблицы, графики и т.д.
Отсюда и пренебрежение ББК/УДК - художественную литературу сканировать значительно проще, и доступно и не напряжно любому желающему. Как правило, желающий далек от понимания важности такой мелочи.

Цитата:

Дополнил genres_fb2.glst и genres_nonfb2.glst
Списки забрал. Будут лежать до готовности таблицы с ББК.
Кстати, вместо BookID вполне подойдет и MD5.

gav-m

Как я вас понимаю.... Определение жанров оказалась для меня, например, задачей близкой к неразрешимой. В библиотеке ФИДОНЕТ в жанрах бардак

regidrer

Krutass

Вероятно,из-за того, что формальным стандартом для научтеха являются форматы pdf и djvu. Внедрение в fb2, epub и другие форматы мобильных девайсов, формул, схем, диаграмм, иллюстраций сводит на нет преимущества компактности fb2. А для художки точное жанровое определение не так важно, по-этому и не стали париться создатели fb2. Хотя в принципе можно написать разработчикам fb2, чтобы ввели классификатор ББК/УДК/ГРНТИ в следующих версиях. Будут ли слушать?

Krutass

Drunkenmunky писал(а):

Цитата:

Почему из формата FB2 полностью исключили все существующие классификаторы ББК/УДК/ГРНТИ ?? не осталось места для 6-8 цифр? И второй страницы книги с классификаторами, как правило, нет, если книга выложена в формате FB2(
Опять неправильный вывод.
В fb2, в массе своей, хранится художественная литература, у которой не так уж и много жанров.
Сканирование технической литературы сопряжено с тем, что требует тщательной вычитки и правки текста. Так как имеющийся для этого софт весьма некорректно распознаёт формулы, термины, таблицы, графики и т.д.
Отсюда и пренебрежение ББК/УДК - художественную литературу сканировать значительно проще, и доступно и не напряжно любому желающему. Как правило, желающий далек от понимания важности такой мелочи.
такой мелочи? Это не мелочь, а системный подход тех, кто "держит" fb2 ... Сказывается отсутствие системного подхода, т.е. отсутствие Государства, мда...

Цитата:

Списки забрал. Будут лежать до готовности таблицы с ББК. ab ab
Кстати, вместо BookID вполне подойдет и MD5.
эээ.. Набивать базу с помощью EXCEL? 50 000 книг? а других идей у Вас нет, Например, с помощью Блокнота? ag

Drunkenmunky

Цитата:

а других идей у Вас нет, Например, с помощью Блокнота?
В общем резюмируя все вышеобсуждаемое.
Я работаю с тем что есть.
На данный момент у конкретной книги есть:
Папка
Имя файла
md5 этого файла.

По md5 этого файла можно получить его жанр. Из базы Либгена.

Других вариантов у меня нет.
Вы предложили набивать вручную так называемый код ББК и т.д.
Каким образом вы это сделаете, мне по большому счету всё-равно.
Так как я считал важным для вас чтобы жанр файла в INPX соответствовал ББК, то я внес несколько предложений как это можно сделать проще и внести эти данные в INPX.
Теперь же я пришел к выводу, что напрасно трачу время.
Буду делать INPX с теми данными, что есть. Используя список жанров из Либгена.
А там как хотите.

Krutass

Под Базу хорошо заточен MyHomeLib. Он для этого и создан. Там занесение Автора и Названия делается двумя щелчками мыши, даже без копирования через буфер. С параллельным просмотром книги и поиском ББК/УДК на 2-й странице.
Почему мы и не обсуждаеи другие варианты - по скорости MyHomeLib вне конкуренции, Корейцу респект.
А Вы предлагаете вернуться лет на 15 назад и пользовать EXCEL? ab
Может, таки разобраться с "недокументированными" функциями MyHomeLib в режиме Либрусека и сразу делать как надо, т.е пополняемую библиотеку "типа" Либрусека?
Или, по Вашему мнению, "не судьба"?
Показать сообщения:    
Ответить на тему