Mai
Entwicklungen und Neuigkeiten zu Goobi workflow
Zuletzt aktualisiert
Entwicklungen und Neuigkeiten zu Goobi workflow
Zuletzt aktualisiert
Die im April beschriebenen Änderungen an der Maven Infrastruktur haben sich noch einiges länger hingezogen als erwartet. Doch auch an anderen Stellen gab es Fortschritte, zum Beispiel bei den Vokabularen und an einigen Plugins.
Die in den Metadateneditor integrierte Lösung, um ALTO-Dateien zu bearbeiten wurde um eine neue Tagging-Funktionalität ergänzt. Dabei können ein oder mehrere Wörter markiert und zusammen mit einem Entitätstyp sowie mit Normdaten verknüpft werden. Dafür stehen bereits diejenigen Normdaten in einem DropDown Menü zur Verfügung, die in der METS-Datei bereits bekannt sind. Alternativ lassen sich jedoch ebenso auch eigene URLs eingeben, um die Verknüpfung mit den Normdaten zu ermöglichen.
Aufgrund von neuen Anforderungen wird es notwendig, die Verwaltung der Vokabulare deutlich zu überarbeiten. Wir haben uns dafür entschieden, die Vokabulare künftig in einem eigenen Vokabularserver zu verwalten. Dieser steht dann Goobi workflow, Goobi viewer und auch anderen Lösungen mittels einer API zur Verfügung, um Informationen daraus abzufragen. Die Entwicklung steckt noch in einer recht frühen Phase und wird uns voraussichtlich noch einige Wochen begleiten.
In einem Projekt entstand die Notwendigkeit, die Software COPE von Digital Transitions an Goobi workflow anzubinden. Sie dient dazu, die RAW-Dateien aus Capture One unter Beibehaltung aller relevanten Bildinformationen in TIFF-Dateien zu konvertieren. Die besondere Schwierigkeit hierbei war, diese Windows-basierte Software an Goobi anzubinden. Unter der Nutzung von Python-Skripten ist und dies nun gelungen un in Produktivbetrieb gegangen.
Im Kontext eines Projektes wurde es notwendig, eine weitere Transkribus-Anbindung zu implementieren. Hierbei ging es speziell darum, dass bereits digitalisierte Bilddateien für eine Auszeichnung in Transkribus genutzt werden sollten, um um somit eine Ground Truth für neue Erkennungmodelle erzeugen zu können.
Für die Umsetzung dieser Funktionalität wurden daher zwei neue Plugins implementiert. Das erste Plugin ist dafür verantwortlich, die bereits im Goobi viewer veröffentlichte METS-Datei mit den zugehörigen Bilddateien an Transkribus zu melden und sie in die gewünschte Collection des Nutzers dort einzuspielen.
Das zweite Plugin hingegen ist dafür verantwortlich, die in Transkribus angereicherten Daten und die somit erzeugten Ergebnisse als ALTO-Dateien abzuholen und in dem OCR-Ordner des jeweiligen Vorgangs zu speichern.
Die Dokumentation der beiden Plugins findet sich hier:
Das Plugin kann zur Installation hier heruntergeladen werden:
Die aktuelle Versionsnummer von Goobi workflow lautet mit diesem Release: 24.05
. Innerhalb von Plugin-Entwicklungen muss für Maven-Projekte innerhalb der Datei pom.xml
entsprechend folgende Abhängigkeit eingetragen werden: