Links

Mai 2021

Entwicklungen und Neuerungen an Goobi workflow im Mai 2021

Coming soon

  • Erweiterung des Archiv-Management-Plugins
  • Erweiterter Java 11 Support
  • Anpassungen der Exportmöglichkeiten
  • Erweiterung des Umgangs mit musealen Daten aus LIDO

Neue Funktionalität zur Volltextbearbeitung im Metdateneditor als ALTO-Dateien

Der Goobi workflow Metadateneditor erlaubt es schon seit einiger Zeit, sich die OCR-Ergebnisse im Textformat anzusehen. Wenn man dann allerdings einen Erkennungsfehler entdeckt hat, blieben einem nur drei Möglichkeiten:
  1. 1.
    Das Transkriptionsplugin in Goobi workflow nutzen und Text anstelle von ALTO-XML zu exportieren, was allerdings die Markierung von Suchtreffern auf einem Bild im Goobi viewer verhindert.
  2. 2.
    Die ALTO-Datei mit einem separaten Texteditor im Dateisystem editieren. Das ist sehr aufwändig und für Laien kaum machbar.
  3. 3.
    Den Erkennungsfehler nicht korrigieren und versuchen trotzdem ruhig zu schlafen.
Seit dieser Goobi workflow Version gibt es eine neue Möglichkeit:
Oberhalb der Bildanzeige ist ein neuer unscheinbarer Button zum Betreten des Alto-Editors verfügbar
Man kann den neuen integrierten ALTO-Editor innerhalb des Metadateneditors nutzen. Die Koordinaten der Wörter bleiben so erhalten und der Volltext lässt sich fast wie regulärer Fließtext bearbeiten.
Innerhalb des ALTO-Editors läßt sich durch die Seiten navigieren und der Text editieren
Eine Hervorhebung der Zeilen und Wörter erlaubt, dass einfach ersichtlich wird, an welcher Stelle der Seite das jeweilige Wort gedruckt ist.
Das derzeit ausgewählte Wort ist auch auf dem Bild mit einem Rahmen hervorgehoben
Die Dokumentation für die neue Funktionalität ist auch bereits im online zugänglichen Goobi workflow Handbuch zu finden:
4.4. OCR Ergebnisse bearbeiten
Goobi workflow (Deutsch)
https://docs.goobi.io/goobi-workflow-de/user/4/4.4

Layout-Anpassungen im Metadateneditor und schnellere Ladezeiten

Wenn im Metadateneditor eine Aktion ausgelöst wird, wird selten die gesamte Seite neu geladen, damit der Arbeitsfluss nicht unterbrochen und die Scrollposition der einzelnen Container beibehalten werden kann. Bei dieser Art des Aktualisierens der Seite kann der Entwickler entscheiden, welche Teile der Seite genau aktualisiert werden sollen.
In der Vergangenheit wurden bei einigen Aktionen auch Teile der Seite aktualisiert, bei denen es nicht nötig war. Deshalb haben einige Aktionen, wie zum Beispiel das Setzen des Repräsentanten ungewöhnlich lange gedauert. Wir haben den Metadateneditor komplett auf dieses Problem hin überprüft und die Aktualisierung bei allen Aktionen optimiert.

Vermeidung ungewünschten Cachings für Layouts

In der Vergangenheit war es oft der Fall, dass nach einem Update beim ersten Betreten des gerade frisch aktualisierten Goobi das Layout und/oder einige Stylings völlig kaputt waren. Das lag nicht daran, dass die Entwickler schlecht gearbeitet haben, sondern daran, dass Browser wie Chrome oder Firefox Dateien auf dem lokalen Gerät zwischenspeichern, um Ressourcen und Bandbreite zu sparen. Die Dateien werden nur dann neu vom Server heruntergeladen, wenn sie sich geändert haben. Deshalb ist es nach einem Update manchmal vorgekommen, dass sich alte Dateien mit neuen Dateien gemischt haben und deshalb das Layout zerschossen war. In diesem Fall musste die Seite komplett neu geladen werden (mit der Tastenkombination Strg+Shift+R), um die zwischengespeicherten Dateien zu verwerfen und neu zu laden.
Damit dies in der Zukunft nicht mehr geschieht, hängen wir nun bei jedem Goobi Release einen eindeutigen, zur Version gehörenden Text an die Adresse jeder Datei an, die potentiell lokal zwischengespeichert sein könnte. Dadurch fragt der Browser bei neuen Versionen auf jeden Fall stets eine neue Datei an und das Layout sieht nach dem Update sofort korrekt aus, ohne dass geheime Tastenkombinationen gedrückt werden müssen.
Die internen Versionsnummern werden im Quellcode der generierten HTML-Seiten nachgenutzt um ungewünschtes Caching zu vermeiden

Besserer Umgang mit Vorgängen ohne Metadaten

Goobi workflow wird sehr vielseitig eingesetzt. So gibt es auch einige Einrichtungen, die nicht an Metadaten im METS/MODS oder LIDO Format interessiert sind. Bei diesen Einrichtungen ist es aufgefallen, dass Skriptaufrufe zwingend eine meta.xml Datei im Vorgangsordner verlangen, da sie sonst mit einem Fehler abgebrochen werden. Dies wurde nun geändert, so dass die Datei meta.xml bei Skriptaufrufen nur noch dann gelesen wird, wenn auch tatsächlich Metadateninformationen innerhalb des Skriptaufrufs benötigt werden.
Bei Workflows wo die Dateien nicht vorhanden sind oder bereits gelöscht wurden funktionieren Skripte nun weiterhin, wenn sie nicht auf die Metadaten angewiesen sind.

Anpassungen an der Funktionalität von GoobiScript

Nachdem im letzten Monat die GoobiScript-Runtime komplett neu implementiert wurde, sind noch einige Probleme mit GoobiScripts aus Plugins aufgetaucht, die dazu geführt haben, dass die Plugins nicht richtig funktioniert haben. Diese Probleme wurden nun behoben und alles funktioniert wieder so wie gewohnt.
Korrekturen an GoobiScript

Neue Funktionen und Einstellmöglichkeiten des Dashboards

Das erweiterte Dashboard wurde noch weiter erweitert. Es gibt zwei neue Widgets: Das Widget Änderungen der letzten 7 Tage zeigt Schritte an, die in den letzten 7 Tagen abgeschlossen, in Bearbeitung genommen wurden oder Fehler hatten. Das zweite neue Widget zeigt die Schritte an, die sich derzeit in der Warteschlange befinden. Dabei wird der im letzten Monat eingeführte neue INFLIGHT Status zugrunde gelegt.
Das überarbeitete Dashboard erlaubt eine individuelle Festlegung der Positionen für die Widgets
Neu ist außerdem dass das Layout des Dashboards nun individuell über die Nutzereinstellungen konfiguriert werden kann. Diese Konfiguration kann vorgenommen werden, indem innerhalb der nutzerspezifischen Benutzerkonfiguration im Reiter Allgemein die Einstellung Anordnung der Dashboard-Elemente bearbeitet. Jede Zeile innerhalb der Textbox fügt ein Element zum Dashboard hinzu. Dabei besteht jede Zeile aus zwei Teilen, getrennt durch ein Leerzeichen: Zuerst wird eine Zahl angegeben, die die Spalte festlegt, in der das Widget angezeigt werden soll. Der zweite Teil nach dem Leerzeichen ist dann der Name des hinzuzufügenden Widgets.
Die Liste der aktuell verfügbaren Widgets lautet: assignedSteps, batches, htmlBox, itm, processSearch, processTemplates, queue, rss, statisticsProcesses2, statisticsProcesses, taskHistory, tasksLastChanges.
Eine Beispielkonfiguration könnte dabei folgendermaßen aussehen:
1 processSearch
1 assignedSteps
1 tasksLastChanges
1 taskHistory
1 htmlBox
2 statisticsProcesses
2 processTemplates
2 queue
3 rss
Bearbeitung der Inhalte des Dashboards