Akew попробую "на пальцах" объяснить...
дамп БД годичной давности и дамп на последнюю дату отличаются (как должны по всем законам БД) только разницей в описании новых книг. Отсюда, взяв старый дамп, мы берем записи из таблиц "старой" БД и к ним добавляем записи из последних дампов. В общем, работа с несколькими БД, сравнение таблиц по записям и update или добавление новых записей.
отсюда, задача формулировалась в несколько пунктов
1. найти "старые" дампы Либруеска (не самое сложное в нашем случае, т.к., зная любовь владельца к "улучшазерам" я давно уже держу дампы в разных эземплярах, а не переписываю поверх - последний "не пишется поверх предыдущего, а пишется в отдельный каталог)
2. сделать несколько экземпляров БД в Мускуле из определенных дампов + последний дамп
3. написать механизмы автоматизации сравнения - на этом этапе сейчас и находимся, в апреле выйдем на следующий этап
4. сама работа по сверке дампов и формирования "правильной" БД в отдельном экземпляре, из которой и будет делаться дамп для коллекции, в который будут добавляться записи в таблицы о новых поступивших книгах
"Официальная" БД формируется на самой библиотеке Либрусек, она каждые сутки "бекапится" в дамп и этот дамп используется всеми (!!!) создателями коллекций. Другое дело, есть определенные проблемы с формируемым дампом. Поэтому и приходится выполнять сейчас достаточно трудоемкие работы по сравнению нескольких дампов и формированию "правильной" БД для коллекции. Выложить промежуточную БД не совсем правильно, так как этот процесс требует соблюдения определенной технологии и "вставка" одной книги влечет за собой вставки в несколько таблиц, да и технологически работать сравнением нескольких БД проще.
Та работа, которую делают пользователи треккера по выявлению книг, присутствующих в дампе, но отсутствующих в архивах очень полезна, так как позволяет "отыскать" такие книги и затем мы, скачав их с Либрусека, можем вставить в архивы. Что, собственно, и делать начинаем со следующего обновления. Будут изменяться архивы с добавлением книг, найденных пользователями.