-
Notifications
You must be signed in to change notification settings - Fork 4
BSZ Datenabzüge
Unsere Projekte IxTheo (eingeschlossen das Projekt RelBib) und KrimDok benötigen verschiedene sogenannte "Datenabzüge" von Titel- und Normdaten, die täglich (IxTheo), wöchentlich (KrimDok) oder unregelmäßig (IxTheo + KrimDok) im BSZ-FTP-Server für uns zur Verfügung gestellt werden.
Die Abzüge werden durch automatische Prozesse, getriggert durch einen Cron-Eintrag ausgeführt. Das relevante Skript auf unserer Seite ist fetch_marc_updates.py
dessen Konfigdatei /usr/local/var/lib/tuelib/cronjobs/fetch_marc_updates.conf
heißt.
Namensmuster | Server-Verzeichnis | Häufigkeit | Bedeutung bzw. Inhalt |
---|---|---|---|
SA-MARC-ixtheo-JJMMTT.tar.gz | /ixtheo | unregelmäßig, bzw. selten | Komplettabzug mit Lokaldaten |
SA-MARC-ixtheo_o-JJMMTT.tar.gz | /ixtheo | unregelmäßig, bzw. selten | Komplettabzug ohne Lokaldaten |
TA-MARC-ixtheo-JJMMTT.tar.gz | /ixtheo | täglich | Differenzabzug mit Lokaldaten |
TA-MARC-ixtheo-JJMMTT_o.tar.gz | /ixtheo | täglich | Differenzabzug ohne Lokaldaten |
SA-MARC-ixtheo_hinweis-JJMMTT.tar.gz | /ixtheo | unregelmäßig, bzw. selten | Umschreibungen von Komposita-Schlagwörtern |
WA-MARCcomb-sekkor.tar.gz | /sekkor | wöchentlich | Sekundärkorrekturen (geänderte Normdaten ohne Änderung im Titel) |
LOEKXP-JJMMTT | /sekkor | wöchentlich | Löschlisten |
LOEKXP_m-JJMMTT | /ixtheo | wöchentlich | Liste der Datensätze die mit mtex getaggt sind |
Errors_ixtheo_JJMMTT | /ixtheo | täglich | Liste der PPNs die zwar den Abzugskriterien entsprachen aber aus irgend einem Grund nicht exportiert werden konnten |
SA-MARC-krimdok-JJMMTT.tar.gz | /krimdok | unregelmäßig, bzw. selten | Komplettabzug mit Lokaldaten |
SA-MARC-krimdok_o-JJMMTT.tar.gz | /krimdok | unregelmäßig, bzw. selten | Komplettabzug ohne Lokaldaten |
WA-MARC-krimdok-JJMMTT.tar.gz | /krimdok | wöchentlich | Differenzabzug mit Lokaldaten |
WA-MARC-krimdok-JJMMTT_o.tar.gz | /krimdok | wöchentlich | Differenzabzug ohne Lokaldaten |
LOEKXP_k-JJMMTT | /krimdok | wöchentlich | Liste der Datensätze die mit krex getaggt sind |
Errors_krimdok_JJMMTT | /krimdok | wöchentlich | Liste der PPNs die zwar den Abzugskriterien entsprachen aber aus irgend einem Grund nicht exportiert werden konnten |
Der Grund für die Aufteilung in einen Abzug mit und einen Abzug ohne Lokaldaten ist, eine BSZ-seitig eine integrierte Erzeugung eines einzelnen Abzugs mit Datensätzen ohne Lokaldaten und Datensätzen nur mit einer Untermenge aller vorhandenen Lokaldaten nicht möglich ist.
Wir erhalten für IxTheo alle Tübinger Lokaldaten (auch die aller Tübinger Institute), bei KrimDok alle Tübinger Lokaldaten und zusätzlich die Lokaldaten für die Datensätze der Bibliothek des Max-Planck-Institutes zur Erforschung von Kriminalität, Sicherheit und Recht, Freiburg
(Frei85).
Namensmuster | BSZ-Terminologie | Tübinger Terminologie |
---|---|---|
SA... | Sonderabzug | Komplettabzug |
TA... | Täglicher Abzug | Differenzabzug |
WA... | Wöchentlicher Abzug | Differenzabzug |
_o | ohne Lokaldaten | ohne Lokaldaten |
_comb | UTF-8 ohne kombinierende Zeichen |
- Komplett- und Teilabzüge: Innerhalb der gezippten Tar-Archive finden sich jeweils drei Dateien mit dem Namenschema
.*[abc]001.raw
Dateien, die Marc21-Daten enthalten. Hierbei bezeichneta
die Titeldaten, undb
undc
Ausprägungen von Normdaten. - Der Aufbau der Löschlisten ist hier dokumentiert.
- Die Normdatendifferenzabzüge enthalten Titel-, Norm- und Lokaldaten im Format
sekkor-.*.mrc
.
Weitere Informationen im K10plus Wiki