Skip to content
jriedl edited this page Nov 2, 2023 · 20 revisions

Unsere Projekte IxTheo (eingeschlossen das Projekt RelBib) und KrimDok benötigen verschiedene sogenannte "Datenabzüge" von Titel- und Normdaten, die täglich (IxTheo), wöchentlich (KrimDok) oder unregelmäßig (IxTheo + KrimDok) im BSZ-FTP-Server für uns zur Verfügung gestellt werden.

Die Abzüge werden durch automatische Prozesse, getriggert durch einen Cron-Eintrag ausgeführt. Das relevante Skript auf unserer Seite ist fetch_marc_updates.py dessen Konfigdatei /usr/local/var/lib/tuelib/cronjobs/fetch_marc_updates.conf heißt.

Namensmuster Server-Verzeichnis Häufigkeit Bedeutung bzw. Inhalt
SA-MARC-ixtheo-JJMMTT.tar.gz /ixtheo unregelmäßig, bzw. selten Komplettabzug mit Lokaldaten
SA-MARC-ixtheo_o-JJMMTT.tar.gz /ixtheo unregelmäßig, bzw. selten Komplettabzug ohne Lokaldaten
TA-MARC-ixtheo-JJMMTT.tar.gz /ixtheo täglich Differenzabzug mit Lokaldaten
TA-MARC-ixtheo-JJMMTT_o.tar.gz /ixtheo täglich Differenzabzug ohne Lokaldaten
SA-MARC-ixtheo_hinweis-JJMMTT.tar.gz /ixtheo unregelmäßig, bzw. selten Umschreibungen von Komposita-Schlagwörtern
WA-MARCcomb-sekkor.tar.gz /sekkor wöchentlich Sekundärkorrekturen (geänderte Normdaten ohne Änderung im Titel)
LOEKXP-JJMMTT /sekkor wöchentlich Löschlisten
LOEKXP_m-JJMMTT /ixtheo wöchentlich Liste der Datensätze die mit mtex getaggt sind
Errors_ixtheo_JJMMTT /ixtheo täglich Liste der PPNs die zwar den Abzugskriterien entsprachen aber aus irgend einem Grund nicht exportiert werden konnten
SA-MARC-krimdok-JJMMTT.tar.gz /krimdok unregelmäßig, bzw. selten Komplettabzug mit Lokaldaten
SA-MARC-krimdok_o-JJMMTT.tar.gz /krimdok unregelmäßig, bzw. selten Komplettabzug ohne Lokaldaten
WA-MARC-krimdok-JJMMTT.tar.gz /krimdok wöchentlich Differenzabzug mit Lokaldaten
WA-MARC-krimdok-JJMMTT_o.tar.gz /krimdok wöchentlich Differenzabzug ohne Lokaldaten
LOEKXP_k-JJMMTT /krimdok wöchentlich Liste der Datensätze die mit krex getaggt sind
Errors_krimdok_JJMMTT /krimdok wöchentlich Liste der PPNs die zwar den Abzugskriterien entsprachen aber aus irgend einem Grund nicht exportiert werden konnten

Der Grund für die Aufteilung in einen Abzug mit und einen Abzug ohne Lokaldaten ist, eine BSZ-seitig eine integrierte Erzeugung eines einzelnen Abzugs mit Datensätzen ohne Lokaldaten und Datensätzen nur mit einer Untermenge aller vorhandenen Lokaldaten nicht möglich ist. Wir erhalten für IxTheo alle Tübinger Lokaldaten (auch die aller Tübinger Institute), bei KrimDok alle Tübinger Lokaldaten und zusätzlich die Lokaldaten für die Datensätze der Bibliothek des Max-Planck-Institutes zur Erforschung von Kriminalität, Sicherheit und Recht, Freiburg (Frei85).

Namensmuster BSZ-Terminologie Tübinger Terminologie
SA... Sonderabzug Komplettabzug
TA... Täglicher Abzug Differenzabzug
WA... Wöchentlicher Abzug Differenzabzug
_o ohne Lokaldaten ohne Lokaldaten
_comb UTF-8 ohne kombinierende Zeichen

Datenformate

  • Komplett- und Teilabzüge: Innerhalb der gezippten Tar-Archive finden sich jeweils drei Dateien mit dem Namenschema .*[abc]001.raw Dateien, die Marc21-Daten enthalten. Hierbei bezeichnet a die Titeldaten, und b und c Ausprägungen von Normdaten.
  • Der Aufbau der Löschlisten ist hier dokumentiert.
  • Die Normdatendifferenzabzüge enthalten Titel-, Norm- und Lokaldaten im Format sekkor-.*.mrc.

Weitere Informationen im K10plus Wiki