Transkription von Bildinhalten
Dieses Step-Plugin erlaubt es, Transkriptionen von Werken zu erstellen. Die Transkriptionen werden dabei ohne Wort- oder Zeilenkoordinaten erfasst.

Einführung

Das Transkriptions-Plugin erlaubt es dem Benutzer, die txt-OCR Ergebnisse eines Goobi-Vorgangs zu bearbeiten. Dabei werden nebeneinander ein Bild und ein Rich-Text-Editor angezeigt, in dem der Text erfasst werden kann.
Details
Identifier
intranda_step_transcription
Lizenz
GPL 2.0 oder neuer
Kompatibilität
Goobi workflow 20.09
Dokumentationsdatum
11.11.2020

Installation

Zur Nutzung des Plugins müssen diese beiden Dateien an folgende Orte kopiert werden:
1
/opt/digiverso/goobi/plugins/step/plugin_intranda_step_transcription.jar
2
/opt/digiverso/goobi/plugins/GUI/plugin_intranda_step_transcription-GUI.jar
Copied!
Die Konfiguration des Plugins findet innerhalb dessen Konfigurationsdatei plugin_intranda_step_transcription.xml statt. Diese wird unter folgendem Pfad erwartet:
1
/opt/digiverso/goobi/config/plugin_intranda_step_transcription.xml
Copied!

Konfiguration

Die Konfiguration des Plugins ist folgendermaßen aufgebaut:
1
<config_plugin>
2
<!--
3
order of configuration is:
4
1.) project name and step name matches
5
2.) step name matches and project is *
6
3.) project name matches and step name is *
7
4.) project name and step name are *
8
-->
9
10
<config>
11
<!-- which projects to use for (can be more then one, otherwise use *) -->
12
<project>*</project>
13
<step>*</step>
14
15
<!-- which folder to use (master|main|jpeg|source|...) -->
16
<imageFolder>master</imageFolder>
17
18
<!-- display button to finish the task directly from within the entered plugin -->
19
<allowTaskFinishButtons>true</allowTaskFinishButtons>
20
</config>
21
22
</config_plugin>
Copied!
Die Parameter innerhalb dieser Konfigurationsdatei haben folgende Bedeutungen:
Wert
Beschreibung
project
Dieser Parameter legt fest, für welches Projekt der aktuelle Block <config> gelten soll. Verwendet wird hierbei der Name des Projektes. Dieser Parameter kann mehrfach pro <config> Block vorkommen.
step
Dieser Parameter steuert, für welche Arbeitsschritte der Block <config> gelten soll. Verwendet wird hier der Name des Arbeitsschritts. Dieser Parameter kann mehrfach pro <config> Block vorkommen.
imageFolder
Legen Sie hier fest, aus welchem Verzeichnis die Bilder angezeigt werden sollen. Mögliche Werte hierfür sind z.B. master, media oder auch individuelle Ordner wie photos und scans.
allowTaskFinishButtons
Mit diesem Parameter kann ermöglicht werden, dass in der regulären Plugin-Oberfläche bereits Buttons zum Abschließen der Aufgabe angezeigt werden sollen, so dass das Plugin nicht zunächst verlassen werden muss.

Integration des Plugins in den Workflow

Zur Inbetriebnahme des Plugins muss dieses für einen oder mehrere gewünschte Aufgaben im Workflow aktiviert werden. Dies erfolgt wie im folgenden Screenshot aufgezeigt durch Auswahl des Plugins intranda_step_transcription aus der Liste der installierten Plugins.
Zuweisung des Plugins zu einer bestimmten Aufgabe
Sowie ein Nutzer anschließend eine Aufgabe annimmt, die dieses Plugin enthält, kann er dieses aus der Aufgabe heraus betreten.
Plugin innerhalb der angenommenen Aufgabe

Benutzung des Plugins

Nachdem der Nutzer das Plugin betreten hat, kann er dort zwischen den Bilddateien blättern. Zur jeweilig angezeigten Seite wird dabei im rechten Bereich ein Rich-Text-Editor angezeigt, der die eventuell bereits vorhandene Transkription bzw. die ggf. vorhandenen OCR-Ergebnisse anzeigt. In diesem Editor kann nun das bisherige Ergebnis korrigiert oder auch ein ganz neuer Text transkribiert werden.
Plugin innerhalb der angenommenen Aufgabe
Bitte beachten Sie, dass dieses Plugin lediglich eine einfache Transkription von Seiteninhalten erlaubt. Hierbei ist keine Erfassung von Koordinaten für Absätze, Zeilen oder Wörter möglich.