Inhalte löschen
Dieses Step Plugin ermöglicht das automatische selektive Löschen von Inhalten aus einem Vorgang.

Einführung

Das Plugin dient zum automatischen Löschen von Daten eines Vorgangs. Hierzu kann in einer Konfigurationsdatei sehr granular festgelegt werden, welche Daten genau gelöscht werden sollen.

Übersicht

Details
Text
Identifier
intranda_step_deleteContent
Lizenz
GPL 2.0 oder neuer
Kompatibilität
Goobi workflow 2021.10
Dokumentationsdatum
05.12.2021

Installation

Zur Installation des Plugins muss die folgende Datei installiert werden:
1
/opt/digiverso/goobi/plugins/step/plugin_intranda_step_deleteContent.jar
Copied!
Um zu konfigurieren, wie sich das Plugin verhalten soll, können verschiedene Werte in der Konfigurationsdatei angepasst werden. Die Konfigurationsdatei befindet sich üblicherweise hier:
1
/opt/digiverso/goobi/config/plugin_intranda_step_deleteContent.xml
Copied!

Konfiguration des Plugins

Die Konfiguration des Plugins ist folgendermaßen aufgebaut:
1
<config_plugin>
2
3
<config>
4
<project>*</project>
5
<step>*</step>
6
7
<!-- delete all data within the images/ folder -->
8
<deleteAllContentFromImageDirectory>false</deleteAllContentFromImageDirectory>
9
10
<!-- OR delete a single image folder - this is only used if deleteAllContentFromImageDirectory is set to false -->
11
<deleteMediaDirectory>false</deleteMediaDirectory>
12
<deleteMasterDirectory>false</deleteMasterDirectory>
13
<deleteSourceDirectory>false</deleteSourceDirectory>
14
<deleteFallbackDirectory>false</deleteFallbackDirectory>
15
16
<!-- delete all data within the thumbs/ folder -->
17
<deleteAllContentFromThumbsDirectory>false</deleteAllContentFromThumbsDirectory>
18
19
<!-- delete all data within the ocr/ folder -->
20
<deleteAllContentFromOcrDirectory>false</deleteAllContentFromOcrDirectory>
21
22
<!-- OR delete a single ocr folder - this is only used if deleteAllContentFromOcrDirectory is set to false -->
23
<deleteAltoDirectory>false</deleteAltoDirectory>
24
<deletePdfDirectory>false</deletePdfDirectory>
25
<deleteTxtDirectory>false</deleteTxtDirectory>
26
<deleteWcDirectory>false</deleteWcDirectory>
27
<deleteXmlDirectory>false</deleteXmlDirectory>
28
29
<!-- delete export folder -->
30
<deleteExportDirectory>false</deleteExportDirectory>
31
32
<!-- delete import folder -->
33
<deleteImportDirectory>false</deleteImportDirectory>
34
35
<!-- delete processlog folder -->
36
<deleteProcesslogDirectory>false</deleteProcesslogDirectory>
37
38
<!-- delete metadata -->
39
<deleteMetadataFiles>false</deleteMetadataFiles>
40
41
<!-- deactivate all unfinished tasks -->
42
<deactivateProcess>false</deactivateProcess>
43
44
<!-- delete specific metadata in the structure main object (e.g. Monograph or Volume)
45
use the internal ruleset name here, e.g. singleDigCollection, DocLanguage etc.
46
this field is repeatable -->
47
<deleteMetadata name="myMetadataType"/>
48
49
<!-- delete specific process properties, e.g. Font type, Opening angle etc.
50
this field is repeatable -->
51
<deleteProperty name="Opening angle"/>
52
</config>
53
54
</config_plugin>
Copied!
Der Block <config> kann für verschiedene Projekte oder Arbeitsschritte wiederholt vorkommen, um innerhalb verschiedener Workflows unterschiedliche Aktionen durchführen zu können. Die weiteren Parameter innerhalb dieser Konfigurationsdatei haben folgende Bedeutungen:
Wert
Beschreibung
project
Dieser Parameter legt fest, für welches Projekt der aktuelle Block <config> gelten soll. Verwendet wird hierbei der Name des Projektes. Dieser Parameter kann mehrfach pro <config> Block vorkommen.
step
Dieser Parameter steuert, für welche Arbeitsschritte der Block <config> gelten soll. Verwendet wird hier der Name des Arbeitsschritts. Dieser Parameter kann mehrfach pro <config> Block vorkommen.
deleteAllContentFromImageDirectory
Legen Sie hier fest, ob alle Daten aus dem images Ordner gelöscht werden sollen.
deleteMediaDirectory
Legen Sie hier fest, ob der media-Ordner gelöscht werden soll. Diese Option wird nicht ausgewertet, wenn deleteAllContentFromImageDirectory aktiviert ist.
deleteMasterDirectory
Legen Sie hier fest, ob der master-Ordner gelöscht werden soll. Diese Option wird nicht ausgewertet, wenn deleteAllContentFromImageDirectory aktiviert ist.
deleteSourceDirectory
Legen Sie hier fest, ob der source-Ordner gelöscht werden soll. Diese Option wird nicht ausgewertet, wenn deleteAllContentFromImageDirectory aktiviert ist.
deleteFallbackDirectory
Legen Sie hier fest, ob der konfigurierte fallback-Ordner gelöscht werden soll. Diese Option wird nicht ausgewertet, wenn deleteAllContentFromImageDirectory aktiviert ist.
deleteAllContentFromThumbsDirectory
Legen Sie hier fest, ob alle Daten aus dem thumbs Ordner gelöscht werden sollen.
deleteAllContentFromOcrDirectory
Legen Sie hier fest, ob alle Daten aus dem ocr Ordner gelöscht werden sollen.
deleteAltoDirectory
Legen Sie hier fest, ob der alto-Ordner gelöscht werden soll. Diese Option wird nicht ausgewertet, wenn deleteAllContentFromOcrDirectory aktiviert ist.
deletePdfDirectory
Legen Sie hier fest, ob der pdf-Ordner gelöscht werden soll. Diese Option wird nicht ausgewertet, wenn deleteAllContentFromOcrDirectory aktiviert ist.
deleteTxtDirectory
Legen Sie hier fest, ob der txt-Ordner gelöscht werden soll. Diese Option wird nicht ausgewertet, wenn deleteAllContentFromOcrDirectory aktiviert ist.
deleteWcDirectory
Legen Sie hier fest, ob der wc-Ordner gelöscht werden soll. Diese Option wird nicht ausgewertet, wenn deleteAllContentFromOcrDirectory aktiviert ist.
deleteXmlDirectory
Legen Sie hier fest, ob der xml-Ordner gelöscht werden soll. Diese Option wird nicht ausgewertet, wenn deleteAllContentFromOcrDirectory aktiviert ist.
deleteExportDirectory
Legen Sie hier fest, ob der export-Ordner gelöscht werden soll.
deleteImportDirectory
Legen Sie hier fest, ob der import-Ordner gelöscht werden soll.
deleteProcesslogDirectory
Legen Sie hier fest, ob der Ordner gelöscht werden soll, in dem die Dateien verwaltet werden, die im Vorgangslog hochgeladen wurden.
deleteMetadataFiles
Legen Sie hier fest, ob die Metadaten und dazugehörigen Backups gelöscht werden sollen.
deactivateProcess
Wenn diese Option aktiviert wurde, werden alle Schritte des Vorgangs deaktiviert, wenn diese zuvor nicht bereits abgeschlossen wurden.
deleteMetadata
Hier kann ein bestimmtes Metadatum gelöscht werden, das sich auf der Ebene des Werkes in der Metadatendatei befindet. Das Element ist wiederholbar und muss einen gültigen Namen für ein Metadatentyp aus dem Regelsatz verwenden.

Integration des Plugins in den Workflow

Zur Inbetriebnahme des Plugins muss dieses für einen oder mehrere gewünschte Aufgaben im Workflow aktiviert werden. Dies erfolgt wie im folgenden Screenshot aufgezeigt durch Auswahl des Plugins intranda_step_deleteContent aus der Liste der installierten Plugins.
Zuweisung des Plugins zu einer bestimmten Aufgabe
Da dieses Plugin üblicherweise automatisch ausgeführt werden soll, sollte der Arbeitsschritt im Workflow als automatisch konfiguriert werden.

Arbeitsweise des Plugins

Nachdem das Plugin vollständig installiert und eingerichtet wurde, wird es üblicherweise automatisch innerhalb des Workflows ausgeführt, so dass keine manuelle Interaktion mit dem Nutzer erfolgt. Stattdessen erfolgt der Aufruf des Plugins durch den Workflow im Hintergrund und startet die Löschung der konfigurierten Daten. Hierbei werden die konfigurierten Ordner und Daten gelöscht, sofern diese vorhanden sind. Nicht vorhandene Daten werden übersprungen. Wenn konfiguriert wurde, dass der Vorgang deaktiviert werden soll, werden alle Arbeitsschritte durchlaufen und geprüft, ob diese bereits innerhalb des Workflows regulär geschlossen wurden. Sollte dies nicht der Fall sein, wird der Arbeitsschritt deaktiviert.
Nach Abschluss der Löschung wird im Vorgangslog eine Meldung über den Aufruf dieses Plugins und das Löschen der Daten hinzugefügt.