Import von Sisis SunRise Dateien
Dies ist die technische Dokumentation für das Plugin zum Import von Sisis SunRise-Dateien als Vorgänge in Goobi workflow.

Einführung

Diese Dokumentation beschreibt die Installation, Konfiguration und Verwendung des Plugins zum Importieren von Sisis SunRise-Dateien.
Details
Identifier
intranda_import_sisis_sunrise_files
Lizenz
GPL 2.0 oder neuer
Kompatibilität
Goobi workflow 2021.01
Dokumentationsdatum
16.07.2021

Installation

Das Plugin muss in folgendem Ordner installiert werden:
1
/opt/digiverso/goobi/plugins/import/plugin_intranda_import_sisis_sunrise_file.jar
Copied!
Es gibt auch eine Konfigurationsdatei, die sich an folgendem Ort befinden muss:
1
/opt/digiverso/goobi/config/plugin_intranda_import_sisis_sunrise_file.xml
Copied!
Zusätzlich gibt es eine tags-Datei, deren Speicherort in der Konfigurationsdatei angegeben wird:
1
<tags>/path/to/tags.txt</tags>
Copied!

Konfiguration

Die Konfiguration erfolgt über die Konfigurationsdatei plugin_intranda_import_sisis_sunrise_file.xml und kann im laufenden Betrieb angepasst werden.
1
<config_plugin>
2
<config>
3
<!-- which workflow template shall be used -->
4
<template>*</template>
5
6
<!-- define if import shall use GoobiScript to run in the background -->
7
<runAsGoobiScript>true</runAsGoobiScript>
8
9
<!-- Ruleset for the MM files: -->
10
<rulesetPath>src/test/resources/ruleset.xml</rulesetPath>
11
12
<!-- Path to images: -->
13
<imagePathFile>/opt/digiverso/import/images</imagePathFile>
14
15
<!-- Ruleset for the MM files -->
16
<tags>/opt/digiverso/import/tags.txt</tags>
17
18
<!-- Use SGML files? -->
19
<withSGML>false</withSGML>
20
21
<!-- Path to SGML files, if withSGML -->
22
<sgmlPath></sgmlPath>
23
24
<!-- default publication type if it cannot be detected. If missing or empty, no record will be created -->
25
<defaultPublicationType>Monograph</defaultPublicationType>
26
27
<!-- Collection name -->
28
<collection>Disserationen</collection>
29
30
<!-- Prefix to add to every ID number -->
31
<idPrefix>mpilhlt_sisis_</idPrefix>
32
33
<!-- Remove the image files from their original folders -->
34
<moveFiles>false</moveFiles>
35
36
<!-- List of IDs to import. If empty, import all files -->
37
<listIDs></listIDs>
38
39
</config>
40
</config_plugin>
Copied!
Die Konfiguration erlaubt unterschiedliche Konfigurationen für verschiedene Produktionsvorlagen. Dazu muss im Feld Template nur der Name des gewünschten Vorlage eingetragen werden. Der Eintrag mit dem Wert * wird für alle Vorlagen verwendet, für die keine eigene Konfiguration existiert.
Konfigurationselement
Verwendung
rulesetPath
Dies ist der Pfad zum Regelsatz für die MetsMods-Dateien.
imagePathFile
Dieser Parameter definiert den Pfad zu den Bilddateien, die sich entweder im Ordner selbst oder in Unterordnern mit dem Namen der Katalogkennung befinden.
tags
Dieser Parameter definiert die Übersetzungsdatei, die mab2-Codes in Metadaten übersetzt.
withSGML
Wenn dieser Parameter auf true gesetzt ist, dann werden SGML-Dateien verwendet. Beachten Sie, dass dies derzeit nicht verwendet wird, sondern für eine spätere Version vorgesehen ist.
sgmlPath
Wenn SGML-Dateien verwendet werden, ist dies der Ordner, in dem sie sich befinden.
defaultPublicationType
Mit diesem Parameter wird der Typ des Dokuments definiert, wenn es keine Kinder oder Eltern hat. Ein Dokument mit Kindern wird als MultiVolumeWork importiert, die Kinder werden als Volumes importiert.
collection
Dies gibt die Metadaten singleDigCollection für die MetsMods-Dateien an, den Namen der Sammlung, zu der die Werke gehören.
listIDs
Hier definieren Sie den Pfad zu einer Textdatei, die eine Liste von Katalogkennungen enthält. Wenn dieses Feld nicht leer ist, dann werden nur Datensätze mit diesen Katalogkennungen aus der Sisis SunRise-Datei importiert.

Tags

Eine Tag-Datei kann etwa so aussehen:
1
0000 CatalogIDDigital
2
0014 shelfmarksource
3
0015 DocLanguage
4
0024 CurrentNoSorting
5
0025 CurrentNoSorting
6
0089 CurrentNo
7
0100 Author
8
0101 OtherPerson
9
0200 Corporation
10
0201 Corporation
11
0304 OtherTitle
12
0310 TitleDocMain
13
0331 TitleDocMain
14
0335 TitleDocSub1
15
0341 OtherTitle
16
0359 StatementOfResponsibility
17
0361 Note
18
0403 EditionStatement
19
0410 PlaceOfPublication
20
0412 PublisherName
21
0413 Printer
22
0425 PublicationYear
23
0432 Stock
24
0433 physicalDescriptionExtent
25
0440 PrintingLocation
26
0451 TitleDocMainSeries
27
0501 Note
28
0519 DissertationNote
29
0540 ISBN
30
0590 Resource
31
0655 URLbib
32
0902 SubjectTopic
33
0907 SubjectTopic
34
0912 SubjectTopic
35
0917 SubjectTopic
36
0922 SubjectTopic
37
0927 SubjectTopic
38
0932 SubjectTopic
39
0937 SubjectTopic
40
1371 OtherTitle
Copied!
Jede Zeile enthält einen MAB-Code, gefolgt von dem Namen der Metadaten, in die er übersetzt werden soll. Jeder Metadatentyp in der Liste muss in dem Regelsatz definiert sein, der für das Projekt verwendet wird, in das die Datei importiert werden soll, und die CatalogIDDigital muss definiert sein, da sie zur Erstellung der Prozess-ID verwendet wird.

Verwendung

Um den Import zu nutzen, muss in den Produktionsvorlagen der Bereich "Massenimport" geöffnet werden und im Reiter "Datei-Upload-Import" das Plugin "intranda_import_sisis_sunrise_file" ausgewählt werden. Anschließend kann eine Sisis SunRise-Datei hochgeladen und importiert werden.
Der Import findet in mehreren Schritten statt. Zunächst wird die gesamte Datei eingelesen, und die Maps child-parent und parent-children werden erstellt und (als JSON-Dateien) im Goobi temp Ordner für den aktuellen Benutzer gespeichert. Diese Maps werden im nächsten Schritt zur Erstellung von Ankerdateien verwendet.
Die Sisis SunRise-Datei wird dann in einzelne Datensätze zerlegt. Für jeden Datensatz wird aus dem Katalog-Identifier (und einem eventuell in der Konfigurationsdatei angegebenen Präfix) der Prozesstitel generiert und geprüft, ob der Prozess bereits in Goobi existiert. Ist dies nicht der Fall, wird der Prozess angelegt und die konfigurierten Metadaten für Anchor und Volume in einem Ordner in dem in der Konfiguration angegebenen Ausgabepfad zwischengespeichert. Eventuelle Bilder werden in einen Unterordner images kopiert.
Im nächsten Schritt werden alle diese Ordner, die die MetsMods-Dateien und die Bilder enthalten, als Vorgänge in Goobi workflow importiert und in die entsprechenden Ordner in Goobi verschoben.
Last modified 4mo ago