Loading...
Error

Дополнение №42 и корректировка №37 к библиотеке FIDONET до состояния на 1 мая 2016г

Страницы:   Пред.  1, 2, 3, 4, 5, 6, 7  След.

Ответить на тему

 | 

 
Автор Сообщение

Drunkenmunky

Цитата:

Список хэшей MD5 всех книжных файлов(52283 файла) всех раздач MyHomeLab(после перехеширования всех раздач)
Забрал.
Прогнал их через скрипт.
Около 2500 файлов не было найдено. Остальное индексируется.
Во вложении таблица с не найденными книгами
Обратите внимание, что многие книги из одних и тех же директорий.
Перепроверьте эти директории на предмет изменений. Поставьте на раздачу, обновите хэш. Возможно они были пропущены.
В список не вошли 403-407 папки.

Цитата:

Сделан программой Arpoon Checksum Version 1.6
Он в том виде как был создан?
Или вы его редактировали? Сменили кодировку например.

Krutass

Это ж «сырые» раздачи. Например, в spec163 находится 80 «мусорных» txt-файлов по 1 Kb, у которых имена продублированы с "настоящими" djvu-файлами, есть и архивы в раздачах, по десятку книг в одном, есть «недоделки», … там разбираться надо.
Поскольку сам сижу "на раздаче", то в и файлы в раздачах не меняю.
к тому же в каждой их 407 раздач от 1 до 4 "служебных" файлов, типа index.html
Разбил на 3 папки: 1A, 2A, 3A
https://yadi.sk/d/ekCMEL32sKw2X

Drunkenmunky писал(а):

Он в том виде как был создан? Или вы его редактировали? Сменили кодировку например.
Программа выдает файл в кодировке Windows 1251, в таком же виде он и отправлен.

Drunkenmunky

Цитата:

к тому же в каждой их 407 раздач от 1 до 4 "служебных" файлов, типа index.html
Эти файлы исключаются заранее

Цитата:

Разбил на 3 папки: 1A, 2A, 3A
https://yadi.sk/d/ekCMEL32sKw2X
Из вашего сообщения непонятно были ли произведены какие-то изменения?

Drunkenmunky

Во вложеннном архиве промежуточный результат.
Готовый к использованию INPX. Для предварительной оценки работоспособности.
Для примера используется папка 399.
Всё проиндексированное открывается.
Остаются не обработанными авторы и жанры.
Блеклым цветом будут выводится "удаленные" на Либгене книги.
Коллекция позволяет изменять описание, автора и пр. Удалять книги. Так что осторожность не помешает.

Krutass

Угу... посмотрю... пока увяз c ББК / УДК
ББК почти добил, завтра файлик сброшу.
а с УДК - еще конь не валялся, а там в 4 раза больше, мдаа..
ББК, судя по всему, составлял школьный методист лет 30 - 50назад... ag а сейчас эти кретины объявили его своей "интеллектуальной собственностью" и стригут купоны... они бы еще Азбуку объявили своей "интеллектуальной собственностью", придурки...

Drunkenmunky

Немного повозился с жанрами.
Возможно, это частный случай, но моя версия MHL(2.2.0.822) не хочет определять GenreAlias в неFB2 коллекциях.
Только GenreCode.
Думаю, это следует учитывать.

Krutass

Drunkenmunky писал(а):

Коллекция позволяет изменять описание, автора и пр. Удалять книги.(??) Так что осторожность не помешает.
Это нельзя делать.
В режиме «Библиотека» Пользователь может удалять только запись в своем Каталоге о книге в режиме «Редактирование». Физическое удаление книг надо исключить в принципе.
Хочешь удалить книгу – удаляй «ручками», под свою ответственность, по другому никак.
Кстати, в Библиотеке «Либрусека» даже режим «Редактирование» блокирован…
Убрать дубли книг по хэшу можно другими программами, к примеру HashSum
Программу можно настроить на поиск дублей по хэшу, размеру, названию.
Для создания списка хэшей надо мышкой перетащить папку с файлами в окно программы.
Интерфейс английский и японский.
http://www.vector.co.jp/soft/dl/winnt/util/se489762.html#download_list

Krutass

Drunkenmunky писал(а):

Немного повозился с жанрами.
Возможно, это частный случай, но моя версия MHL(2.2.0.822) не хочет определять GenreAlias в неFB2 коллекциях.
Только GenreCode.
Думаю, это следует учитывать.(??)
Это следует не только учитывать но и исправить ab Надо добиться совместимости с genres_fb2.gls как у Либрусека
В "Либрусековской" Библиотеке Все полностью определяется структурой INPX(«ключ») и структурой книжных zip-архивов(«замок»)
ИМХО, Надо в своем INPX полностью скопировать и то, и другое, включая и кодировку файлов, тогда и файл жанров genres_fb2.glst заработает
Кстати, файлы жанров genres_fb2.gls(для Либрусека/Флибусты) и genres_nonfb2.glst(для Пользователя) имеют разную структуру и разную кодировку...
намудрил Кореец...хз для чего ag
Кстати, просмотрел Форум у Корейца...
Корейцу на Форуме еще вроде в 2009 году люди предлагали ввести ББК и УДК, и готовую Базу предлагали, но он наотрез отказался, типа это долго,... а для "жанров" хватит десятка пунктов... ага,ага ag

При создании ББК/УДК программой MHLGenreEditor.exe надо заполнять поля «Название жанра» и «Код жанра»
Содержимое поля «Код жанра» затем копируется в соответствующее поле inp-файла Каталога.
- допускаются ли спецсимволы в этих полях? допустима ли кириллица в поле «Код жанра»?
- какая максимальная длина этих полей?
- одинаково ли MyHomeLib фильтрует поле жанров в inp-файле для «Либрусека» и для «Пользователя»?
Все это надо моделировать...
Я «Телепортом» скачал базы ББК и УДК (это не полные базы, но для нас годится)
Может, можно их как-то программно «трансформировать» в «жанры» для MyHomeLib?
В архиве также "пользовательский"genres_nonfb2.glst и "либрусековский"genres_fb2.gls «жанры» MyHomeLib с ББК(немного неполный) и УДК(только оболочка), сделаны «вручную»
В поле «Название жанра» я убирал кавычки, запятые и(по возможности) скобки"( )". ББК-код, есс-но, не менял.
В поле «Код жанра» менял в ББК-коде кириллицу на латиницу, скобки"( )" заменял на подчеркивание"_" равенство"=" заменял на двойное подчеркивание"__"
т.е. в поле "Код жанра" только цифры и латинские буквы, а из "спецсимволов" только точка"." тире "-" и подчеркивание"_"
Перестраховка? .. хз
https://yadi.sk/d/EUhpQAZ-sPowZ

Drunkenmunky

Куда-то вас не туда понесло.
Поведение MHL касаемое списка жанров при импорте данных из INPX, как я это понимаю, регулируется специальным кодом в файле collection.info.
Если он установлен в 0, то при импорте, да и вообще в коллекции используется fb2 список жанров.
При этом коллекция редактируема.
Если там стоит 1, то используется не-fb2 список.
Если же там другой код, например 65536(либрусек все типы файлов), то третье поведение, мануала по этим кодам я не видел, остается только догадываться.
Так вот, возвращаясь к не-fb2 списку, при импорте из inpx для не-fb2 коллекций, вместо т.н. альяса жанра (sci_tec например) надо подавать код жанра (0.10.0.0 для этого же примера) потому что иначе альяс просто игнорируется, и MHL записывает все жанры как "неотсортированное". То ли так и задумано, то ли программная ошибка.

Что я предлагаю.
Возьмите вложенную в этом сообщении таблицу.
Создайте в ней дополнительную или очистите колонку "язык" и напротив жанров используемых ЛибГеном введите те жанры которые вы считаете нужным.
А я потом на основе этой таблицы сделаю не-fb2 список жанров.

Цитата:

Убрать дубли книг по хэшу можно другими программами,
К чему это? В создаваемой коллекции нет дублей книг в принципе.

Krutass

Drunkenmunky писал(а):

Куда-то вас не туда понесло.
Поведение MHL касаемое списка жанров при импорте данных из INPX, как я это понимаю, регулируется специальным кодом в файле collection.info.
Если же там другой код, например 65536(либрусек все типы файлов), то третье поведение, мануала по этим кодам я не видел, остается только догадываться.
Ну чтож, раз такая безнадега такой расклад, остается только платить и каяться надеяться, что Кореец таки выдаст мануал на "недокументированные" функции ab
По сабжу:
Структура строки в файле жанра genres_nonfb2.glst "для Пользователя" ( структура строки в genres_fb2.glst "для Либрусека" немного отличается, но в целом аналогична):
[Номер жанра] [разделитель «Пробел»] [Код жанра] [разделитель-«точка с запятой»][Описание жанра]
Как переделать INPX "под Либрусек"
С помощью MyHomeLib Создаем INPX, потом в каждой строке inp-файла, во втором поле GENRE меняем «Номер жанра» на «Код жанра» ab

Drunkenmunky

Цитата:

Как переделать INPX "под Либрусек"
Не требуется ничего переделывать.
Из базы Либгена можно получить код жанра.
Но в базе ЛибГена другие коды жанров.
Чтобы оно работало с жанрами Либрусека, жанры ЛибГена нужно ассоциировать с жанрами Либрусека.
Что я и предложил вам сделать сообщением выше.

Krutass

Drunkenmunky писал(а):

Цитата:

Как переделать INPX "под Либрусек"
Из базы Либгена можно получить код жанра.
Но в базе ЛибГена другие коды жанров.
Чтобы оно работало с жанрами Либрусека, жанры ЛибГена нужно ассоциировать с жанрами Либрусека.
Что я и предложил вам сделать сообщением выше.
Есть 2 официальнах системы "жанров" - ББК и УДК. (Есть еще ГРНТИ, но она рождается в муках ab)
На 2-й странице любой книги. С ними и надо делать "Ассоциацию"
Все остальные "жанры" - от лукавого. Лучше, хуже - неважно, но они менее удобны для Пользователя, особенно для Технической литературы, т.к. у них нет общепринятого кода.
Можно делать параллельно, одну (Либрусековскую, ЛибГена) для беллетристики, другую (УДК/ББК) - для научно-технической.

Drunkenmunky писал(а):

Цитата:

Как переделать INPX "под Либрусек"
Не требуется ничего переделывать.
Может, вам это просто не под силу, тогда извините за беспокойство. ab

Drunkenmunky

Цитата:

Может, вам это просто не под силу, тогда извините за беспокойство.
Лично меня устраивают жанры ЛибГена.
Очень даже может быть, что где-то в муках что-то рождается. И очень же может быть, что это что-то лучше для научно-технического прогресса и литературы.
И даже готов способствовать. Способ описан двумя моими сообщениями выше.
Впишите в предлагаемую таблицу то, что считаете необходимым.
И оно будет работать.
И при этом мне не придется забивать голову тем, чему лично я применения не вижу.
Повторюсь - меня устроят и ЛибГеновские жанры.

Krutass

Drunkenmunky писал(а):

Цитата:

Может, вам это просто не под силу, тогда извините за беспокойство.
Лично меня устраивают жанры ЛибГена.
...............
Повторюсь - меня устроят и ЛибГеновские жанры.
В данном случае мы с вами - Библиотекари. Что нам нравится-не нравится - Читателям по барабану.
Дело в том, что Библиотекари в своей массе не очень-то и образованы... ab
Когда приходит машина с книгами, Библиотекари распихивают книги по полкам исходя из номеров УДК и ББК, а не из своих глубоких познаний в Математике/Биологии/Радиоэлектронике

Drunkenmunky

Цитата:

Библиотекари распихивают книги по полкам исходя из номеров УДК и ББК,
Проблема в том, что мы обсуждаем библиотеку со сканированными печатаемыми документами.
И что бы узнать этот самый ББК/УДК нужно физически открыть файл.
Более того, многие файлы в этой библиотеке представляют из себя вырезки, цитаты и самиздат.
Авторы которых имеют об обсуждаемом предмете еще меньшее представление, чем я. А следовательно не заморачивались указанием.
Показать сообщения:    
Ответить на тему