Extraktion von Bildmetadaten
Dieses Step Plugin erlaubt die Extraktion von Metadaten aus Bilddateien, um diese innerhalb der METS-Dateien zu speichern.

Einführung

Mit Hilfe dieses Plugins können Metadaten aus Bilddateien extraiert und innerhalb der METS-Dateien von Goobi gespeichert werden. Hier findet im Hintergrund eine Nutzung des Linux-Programms ExifTool statt, um dessen gelesene Bildmetadaten gemäß individueller Konfiguration zu überführen.

Übersicht

Details
Identifier
intranda_step_imageMetadataExtraction
Lizenz
GPL 2.0 oder neuer
Kompatibilität
Goobi workflow 2020.12
Dokumentationsdatum
02.04.2021

Installation

Zur Installation des Plugins muss die folgende Datei installiert werden:
1
/opt/digiverso/goobi/plugins/step/plugin_intranda_step_imageMetadataExtraction.jar
Copied!
Um zu konfigurieren, wie sich das Plugin verhalten soll, können innerhalb der Konfigurationsdatei verschiedene Parameter angepasst werden. Die Konfigurationsdatei befindet sich üblicherweise unter folgendem Pfad:
1
/opt/digiverso/goobi/config/plugin_intranda_step_imageMetadataExtraction.xml
Copied!

Konfiguration des Plugins

Die Konfiguration des Plugins ist folgendermaßen aufgebaut:
1
<config_plugin>
2
3
<config>
4
<!-- which projects to use for (can be more then one, otherwise use *) -->
5
<project>*</project>
6
<step>*</step>
7
8
<command>/usr/bin/exiftool</command>
9
<field line="Object Name" metadata="TitleDocMain" />
10
<field line="Keywords" metadata="SubjectTopic" />
11
<field line="Special Instructions" metadata="Footnote" />
12
<field line="City" metadata="PlaceOfPublication" />
13
<field line="Source" metadata="singleDigCollection" />
14
<field line="Copyright Notice" metadata="AccessCondition" />
15
<field line="Caption-Abstract" metadata="Abstract" />
16
</config>
17
18
</config_plugin>
Copied!
Der Block <config> kann für verschiedene Projekte oder Arbeitsschritte wiederholt vorkommen, um innerhalb verschiedener Workflows unterschiedliche Aktionen durchführen zu können. Die weiteren Parameter innerhalb dieser Konfigurationsdatei haben folgende Bedeutungen:
Wert
Beschreibung
project
Dieser Parameter legt fest, für welches Projekt der aktuelle Block <config> gelten soll. Verwendet wird hierbei der Name des Projektes. Dieser Parameter kann mehrfach pro <config> Block vorkommen.
step
Dieser Parameter steuert, für welche Arbeitsschritte der Block <config> gelten soll. Verwendet wird hier der Name des Arbeitsschritts. Dieser Parameter kann mehrfach pro <config> Block vorkommen.
command
Innerhalb dieses Parameters wird der Pfad zu dem Program ExifTool angegeben. Hierbei handelt es sich um ein serverseitig installiertes Programm, das die Metdaten aus Bilddateien auslesen kann.
field
Für jedes gewünschte Metadatum, das pro Bild ausgelesen werden soll, kann jeweils ein field gegeben werden, das aus den Attributen line und metadata besteht.
Die Definition von Feldern, erfolgt mit den folgenden Parametern:
Wert
Beschreibung
line
Mit diesem Parameter wird festgelegt, wie das Metdatum innerhalb des Ergebnisses von ExifTool heisst. Geben Sie hier entsprechend den Namen an, wie das Metadatum innerhalb des Bildes vorliegt.
metadata
Dieser Parameter legt fest, unter welchem Metadatentyp der Inhalt des gelesenen Metatums in der METS-Datei gespeichert wird. Verwendet wird hierbei der interne Name des Metadatentyps, wie er im zugehörigen Regelsatz definiert wurde. Zu beachten ist hierbei, dass die Metaten jeweils auf der Ebene des höchsten logischen Strukturelements (z.B. einer Monographie) gespeichert werden und nicht an untergeordneten logischen oder physischen Elementen.

Integration in den Workflow

Zur Inbetriebnahme des Plugins muss dieses in einer Aufgabe im Workflow aktiviert werden. Dies erfolgt durch Auswahl des Plugins intranda_step_imageMetadataExtraction aus der Liste der installierten Plugins. Da das Plugin auf eine METS/MODS Datei angewiesen ist, sollte der Arbeitsschritt nach der Metadatenbearbeitung stattfinden.
Zuweisung des Plugins zu einer bestimmten Aufgabe

Arbeitsweise des Plugins

Nachdem das Plugin vollständig installiert und eingerichtet wurde, wird es üblicherweise automatisch innerhalb des Workflows ausgeführt, so dass keine manuelle Interaktion mit dem Nutzer erfolgt. Stattdessen erfolgt der Aufruf des Plugins durch den Workflow im Hintergrund und führt die Extraktion der Bildmetadaten automatisch aus. Hierzu wird die erst Bilddatei aus dem media-Verzeichnis des Goobi-Vorgangs geöffnet, deren Metadaten ausgelesen und auf der obersten logischen Ebene der METS-Datei als das konfigurierte Metadatum gespeichert.
Last modified 7mo ago