Liechtenstein Volksblatt Importer
Einführung
Dieses Workflow-Plugin wurde implementiert, um Metadaten aus den Dateinamen sowie einer Konfigurationsdatei zu lesen und Vorgänge sowie Metadaten korrekt zu erstellen oder zu aktualisieren. Dieses Plugin wurde ursprünglich für den Import von Zeitungsausgaben des Liechtensteiner Volksblatt entwickelt, kann aber auch für andere Importe verwendet werden, solange deren Seitennamen dem gleichen Muster wie 001_vbhp_4c_2019-01-11
folgen, wobei die ersten drei Ziffern die Ordnungsnummer dieser Seite innerhalb ihrer Ausgabe angeben und das abschließende Datum das Datum der Ausgabe ist. Der dazwischen liegende Text der Beschreibung spielt keine Rolle, solange er nicht mit dem regulären Ausdruck \d{4}-\d{2}-\d{2}
übereinstimmt, der für die Speicherung des Ausgabedatums reserviert ist.
Übersicht
Details | |
---|---|
Identifier | intranda_workflow_liechtenstein_volksblatt_importer |
Source code | |
Lizenz | GPL 2.0 oder neuer |
Dokumentationsdatum | 16.11.2023 |
Installation
Zur Installation des Plugins müssen folgende beiden Dateien installiert werden:
Um zu konfigurieren, wie sich das Plugin verhalten soll, können verschiedene Werte in der Konfigurationsdatei angepasst werden. Die Konfigurationsdatei befindet sich üblicherweise hier:
Konfiguration
Die Konfigurationen sollten in der Konfigurationsdatei vorgenommen werden, die wie das folgende Beispiel aussehen kann:
Die einzelne Parameter werden folgendermaßen verwendet:
Wert | Beschreibung |
---|---|
| Pfad zu dem Ordner, der die separierten Zeitungsseiten für den Import enthält. |
| Name der zu verwendenen Produktionsvorlage. |
| Bei des Wertes |
| Aus jedem hier angegebenen Element wird ein eigenständiges Metadatum erstellt. Er akzeptiert sechs Attribute, wobei |
Verwendung des Plugins
Für das Plugin ist nicht entscheidend, welche Dateiformate die zu importierenden Zeitungsseiten haben, da alle Metadaten, die abgespeichert werden müssen, direkt aus den Dateinamen sowie aus der Konfigurationsdatei gelesen werden. Die Seitendateien werden in die Master-Ordner der entsprechenden Goobi-Vorgänge verteilt.
Die Dateiformate in den Dateiverknüpfungen, die von diesem Plugin in der METS-Datei angelegt werden, werden zu
tiff
undjpg
geändert, da nur diese vom Metadaten-Editor korrekt wiedergegeben werden können. Wenn die Seiten nach dem Import nicht korrekt betrachtbar sind, muss ggf. zuvor ein Konvertierungsschritt der Dateien erfolgen. Für den Fall dass es sich hierbei um zu importierende PDF-Dateien handelt, könnte ein solcher Arbeitssschritt wie folgt aussehen:Installieren des Pakets
pdftoppm
, falls noch nicht geschehenErzeugen einer Skriptdatei unter dem Namen
/opt/digiverso/goobi/scripts/script_convertPdfToTiff.sh
Erstellen eine Arbeitsschritts im Workflow mti dem Pfad zu dem Skript
/opt/digiverso/goobi/scripts/script_convertPdfToTiff.sh "{origpath}"
Last updated