MAB-Dateien einlesen
Import Plugin für die Übersetzung von MAB2- und SGML-Daten in METS-MODS
Übersicht
Name | Wert |
---|---|
Identifier | intranda_import_mab |
Repository | |
Lizenz | GPL 2.0 oder neuer |
Letzte Änderung | 25.08.2024 10:43:21 |
Einführung
Das Programm untersucht die hinterlegte MAB2-Datei und übersetzt die Felder in Metadaten für eine METS-Datei. Falls vorhanden, wird auch eine SGML-Datei untersucht, um die Strukturdaten zu spezifizieren.
Installation
Um das Plugin nutzen zu können, müssen folgende Dateien installiert werden:
Die Datei goobi-plugin-import-mab.jar
enthält die Programmlogik und ist eine ausführbares Datei.
Die Datei goobi-plugin-import-mab.xml
ist die Konfigurationsdatei.
Überblick und Funktionsweise
Die Mappings mapMVW und mapChildren werden erzeugt. Dafür wird die jar-Datei gestartet, wobei der Pfad zur Konfigurationsdatei als erster Parameter und als weitere Parameter der/die Pfad(e) zu den MAB-Dateien übergeben werden, die bearbeitet werden sollen. Damit werden die Mapping-Dateien erzeugt und gespeichert.
Das Programm wird als JAR geöffnet, wobei der Pfad zur Konfigurationsdatei als einziger Parameter übergeben wird.
Aus der Konfigurationsdatei werden die Pfade zur MAB2-Datei usw. ausgelesen, und die MAB2-Datei wird durchgelesen..
Für jedes Dataset in der Datei wird ein METS-MODS-Dokument mit den passenden Metadaten erzeugt. Die Übersetzung der einzelnen Felder erfolgt mittels der Tags-Datei.
Wenn
withSGML
true ist, dann wird im OrdnersgmlPath
nach SGML-Dateien gesucht, die die CatalogID als Namen haben. Das METS-MODS-Dokument erhält dann daraus die Struktur.Für jede Seite im Dokument werden die passenden Bilder im Ordner
imagePathFile
gesucht, in den Unterordnern, die die CatalogID als Namen haben. Diese werden dann in den Image-Ordner kopiert, und Referenzen in der structMap erstellt.BEMERKUNG: Aktuell werden die Bilder NICHT mit den korrekten Berechtigungen kopiert. Das bedeutet, dass vor dem Import in Goobi alle erzeugten Ordner und Dateien dem Benutzer
tomcat8
mittelssudo chown -R tomcat8 *
zugewiesen werden müssen!Danach können die Vorgägne mit dem Goobi Plugin für den Folder Import importiert werden.
Konfiguration
Die Konfiguration des Plugins erfolgt in der Datei goobi-plugin-import-mab.xml
wie hier aufgezeigt:
Die folgende Tabelle enthält eine Zusammenstellung der Parameter und ihrer Beschreibungen:
Parameter | Erläuterung |
---|---|
| Dieser Parameter dient zur Festlegung des Projekt, für das diese Konfiguration gelten soll. |
| Dieser Parameter liefert den Pfad zur Ruleset-Datei für die METS-Dateien. |
| Hier wird der Pfad zu den Image-Dateien angegeben, die im Unterordner mit dem Namen der CatalogId liegen. |
| Dieser Parameter gibt an, wohin die fertigen METS-Ordner kopiert werden. Die Unterordner werden dabei nach der CatalogId benannt. |
| Hier wird die MAB2-Datei spezifiziert, die gelesen werden soll. |
| Dieser Parameter spezifiziert die Übersetzungsdatei, die MAB2-Codes in METS-Metadaten übersetzt. |
| Wenn dieser Wert auf |
| Dieses Element spezifiziert den METS-Typ der Dokumente für den Fall, dass diese keine Kinder oder Eltern haben. Ein Dokument mit Kindern wird als MultiVolumeWork importiert, während die Kinder als Volumes importiert werden. |
| Dieser Parameter spezifiziert die Metadaten für die |
| Das Element |
| Dieses Element spezifiziert den Pfad zu einer JSON-Datei, in der die MultiVolumeWork-IDs zusammen mit einer Liste der dazugehörigen Volume-IDs gespeichert sind. |
| Dieser Parameter legt fest, wie viele Vorgänge zuerst angelegt werden sollen. Wenn der Wert |
| Dieser Parameter gibt den Pfad zu einer Textdatei an, in der eine Liste von IDs enthalten ist. Wenn die Datei existiert und nicht leer ist, werden nur Vorgänge für diese IDs erzeugt. Dies wird genutzt, um nachträglich geänderte oder verbesserte Vorgänge neu zu importieren. |
| Dieser Parameter ist auf "true" zu setzen, wenn alle zu importierenden Dokumente als |
Last updated