config_contentServer.xml
In der Datei config_contentServer.xml
werden technische Details zu dem von Goobi verwendeten Content Server angegeben. Diese Konfigurationsdatei kann für Goobi Workflow und Goobi Viewer gleichermaßen verwendet werden.
Die Datei befindet sich üblicherweise an folgendem Speicherpfad:
Beispielhaft sieht diese Konfigurationsdatei wie folgt aus:
Datentypen
In dieser Konfigurationsdatei werden Einstellungen mit unterschiedlichen Datentypen vorgenommen. Zur Übersicht werden alle verwendeten Typen in der folgenden Tabelle kurz erklärt:
Datentyp | Beispiele | Bedeutung |
---|---|---|
|
| Boolscher Wert: kann wahr oder falsch sein |
|
| Text: kann beliebige Zeichen beinhalten |
|
| Ganzzahl: kann alle positiven oder negativen Zahlen (oder 0) beinhalten |
|
| Große Ganzzahl: Wie |
|
| Gleitkommazahl: Kommazahl mit wenigen Stellen Präzision |
|
| Gleitkommazahl: Kommazahl mit vielen Stellen Präzision |
Allgemeine Einstellungen und Standardwerte
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| string | /opt/digiverso/config/config_contentServer.xml` | Dieser Parameter kann im Element |
| integer |
| Dieser Parameter kann im Element |
| integer |
| Dieser Wert gibt ein Timeout an, das beim Senden von Bilddateien nicht überschritten werden darf. |
| string |
| Dieses Element gibt den Pfad zu einer Bibliothek an, mit der Bilddateien verarbeitet werden sollen. |
Zusätzlich können im Element imageToPdfSizeFactor
beliebige Parameter für Dateitypen gesetzt werden, für die ein spezieller Faktor für die Skalierung von diesem Dateityp zu einer PDF-Datei verwendet werden soll (siehe Beispiel). In dem Fall werden die Bilddateiendungen als Parametername und die Skalierungen als Wert verwendet. Eine Skalierung von 1.0 bedeutet dabei, dass die Bildgröße gleich bleibt. Werte unter 1.0 oder über 1.0 verkleinern oder vergrößern das Bild. Der Wert 0 sollte nicht verwendet werden.
Die Größe von Bilddateien kann auf dem Content-Server begrenzt werden. Folgende Parameter können im Element maxFileLength
verwendet werden:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| integer |
| Dieser Parameter gibt die maximale Dateigröße in Megabyte an. 0 kann angegeben werden, um die Größenbegrenzung zu deaktivieren. |
| string | Dieser Parameter gibt eine Datei an, die im Fehlerfall (bei einer zu großen Datei) ersatzweise verwendet werden kann. |
Für verschiedene Anwendungszwecke kann es sinnvoll sein, Bilder unterschiedlich zu skalieren. Folgende Parameter können im Element scaling
verwendet werden:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| string |
| Dieser Parameter gibt die Skalierungsqualität an. Es können die Werte |
| string |
| Dieser Parameter gibt die Skalierungsqualität für Vorschaubilder an. Es können die Werte |
| integer |
| Dieser Parameter gibt zusätzlich einen Qualitätsfaktor für das Skalieren von Bilddateien mit der "Java Advanced Imaging" Bibliothek (JAI) an. Er kann zwischen 0 und 99 liegen. Bilddateien haben eine höhere Qualität, je höher dieser Wert ist. Ein geringerer Wert hingegen beschleunigt den Ladevorgang. Empfohlen werden Werte zwischen 10 und 50. |
Zum Herunterladen von Bildern, die im Content-Server generiert wurden, kann hier ein standardmäßiger Dateiname angegeben werden. Folgende Parameter können in den Elementen image
und pdf
innerhalb des Elementes defaultFileNames
verwendet werden:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| string |
| Dieser Parameter gibt an, wie ein Dateiname gebildet werden soll. Dabei kann |
| boolean |
| Dieser Parameter gibt an, ob in der Serverantwort ein |
Für nicht-vollständige Anfragen an den Content-Server können Standard-Pfade für Speicherorte verschiedener Dateitypen angegeben werden. Folgende Parameter können in den Elementen defaultRepositoryPathImages
, defaultRepositoryPathPdf
, defaultRepositoryPathAlto
und defaultRepositoryPathMets
verwendet werden:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| boolean |
| Dieser Parameter kann bei den Elementen |
| string |
| Dieser Parameter kann bei allen Elementen verwendet werden und gibt den Pfad zu dem entsprechenden Ordner an. |
| string | Dieser Parameter kann nur bei |
Der Datentyp image
umfasst zunächst alle Bilddateitypen, die nicht näher spezifiziert sind. Daher können mit defaultImageConfig
Einstellungen zu Bilddateien getroffenwerden. Folgende Parameter können im Element defaultImageConfig
verwendet werden:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| string |
| Dieser Parameter gibt den Standard-Bildtyp an. |
PDF-Dateien werden separat konfiguriert, da sie im Gegensatz zu anderen Bilddateiformaten einige spezielle Eigenschaften haben. Folgende Parameter können im Element defaultPdfConfig
verwendet werden:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| string |
| Dieser Parameter gibt die Seitengröße des PDF-Dokumentes an. Mögliche Werte sind |
| float |
| Dieser Parameter gibt die Auflösung (Pixel pro Zoll / Dots Per Inch) an. Die Bilddateigröße (in Pixeln) bleibt dabei gleich. 0 kann angegeben werden, um die Skalierung der Auflösung zu deaktivieren. |
| float |
| Dieser Parameter gibt die Bildskalierung an. 1.0 bedeutet dabei die Originalgröße. Ein Wert unter 1.0 verringert die Bildgröße, ein Wert über 1.0 vergrößert diese. Dieser Wert sollte nicht auf 0 gesetzt werden, da ansonsten das Bild verschwindet (0 Pixel Größe). |
| string | Dieser Parameter gibt an, wie die Bilddatei skaliert werden soll. In diesem Feld wird eine Kombination zweier positiver Zahlen (Breite und Höhe) erwartet. Dabei werden beide Zahlen von einem | |
| integer |
| Dieser Parameter gibt an, wie stark die Bilddatei komprimiert werden soll. 0 ist ein Standardwert, bei dem automatisch eine passende JPEG-Komprimierung ausgewählt wird. 0 sollte normalerweise immer verwendet werden. |
| boolean |
| Dieser Parameter gibt an, ob die Bilddatei zu Graustufen konvertiert werden soll. |
| boolean |
| Dieser Parameter gibt an, ob die Bilddatei vom Typ PDF-A sein soll. |
| string |
| Dieser Parameter gibt an, welche Metadatengruppe verwendet werden soll. |
| string | In diesem Parameter kann eine URL angegeben werden, die beim Export von PDF-Dateien nicht als Bezugsquelle für Metainformationen verwendet werden soll. |
Zum Markieren verschiedener Bildelemente kann eine Farbe festgelegt werden. Folgende Parameter können im Element defaultHighlightColor
verwendet werden:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| integer |
| Dieser Parameter gibt den Rot-Wert im Bereich von 0 bis 255 an. |
| integer |
| Dieser Parameter gibt den Grün-Wert im Bereich von 0 bis 255 an. |
| integer |
| Dieser Parameter gibt den Blau-Wert im Bereich von 0 bis 255 an. |
| integer |
| Dieser Parameter gibt den Alpha-Wert (Transparenz) im Bereich von 0 bis 255 an. |
Folgende Tabelle zeigt einige einfache Farbbeispiele:
Konfiguration | Farbe |
---|---|
| Schwarz |
| Blau |
| Grün |
| Cyan |
| Rot |
| Magenta |
| Gelb |
| Weiß |
Dabei bedeuten alpha="255"
eine volle Deckkraft der Farbe (überdeckt also den Bildausschnitt komplett) und alpha="0"
keine Deckkraft (unsichtbar).
Bilddateitypen
Innerhalb des Elementes imageTypeSettings
sind Einstellungen zu beliebig vielen Bilddateitypen definierbar. Für jeden Bilddateityp wird ein type
-Element mit dem Unterelement settings
angegeben.
Für Dateitypen (type
) können folgende Parameter verwendet werden:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| string |
| Dieser Parameter gibt den Typ der Bilddatei an. Dieser Typ entspricht der zugehörigen Dateiendung. |
| double |
| Dieser Parameter gibt an, wie groß (in Bytes) eine Bilddatei mindestens sein muss. |
| double |
| Dieser Parameter gibt an, wie groß (in Bytes) eine Bilddatei maximal sein darf. |
| string |
| Dieser Parameter gibt eine Art der Komprimierung an. |
| string |
| Dieser Parameter gibt an, auf welche Art Farbwerte gespeichert werden. |
| string |
| Dieser Parameter gibt ein Farbprofil an. |
| boolean | Dieser Parameter gibt an, ob Wasserzeichen verwendet werden sollen. |
Hinweis: Die Parameter minSize
und maxSize
werden in der Konfiguration als Gleitkommazahlen abgefragt, später allerdings als long
-Zahlen weiterverarbeitet. Daher sollten nur Ganzzahlen angegeben werden.
Für Dateitypen-Einstellungen (settings
) können folgende Parameter verwendet werden:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| string | Dieser Parameter gibt eine Java-Klasse an, die Bilddateien dieses Dateityps lesen kann. | |
| string | Dieser Parameter gibt eine Java-Klasse an, die Bilddateien dieses Dateityps schreiben kann. | |
| boolean |
| Dieser Parameter gibt an, ob die "Java Advanced Imaging" Bibliothek (JAI) verwendet werden soll. |
| bollean |
| Dieser Parameter gibt an, ob Bilder mit der "Java Advanced Imaging" Bibliothek (JAI) gerendert werden sollen. |
| boolean |
| Dieser Parameter gibt an, ob Bilder mit dem "Scalr"-Algorithmus skaliert werden sollen. Dieser liefert nochmals bessere Ergebnisse, ist allerdings langsamer. Normalerweise sollte dieser Wert |
| boolean |
| Dieser Parameter gibt an, ob Bilder bei der Verarbeitung gepuffert werden sollen. |
| boolean |
| Dieser Parameter gibt an, ob Bilder bei der Verarbeitung zu dem Farbmodell |
| boolean |
| Dieser Parameter gibt an, ob Bilder, die nicht mehr weiterverarbeitet werden müssen, direkt aus den Rohdaten übernommen werden sollen. Wird diese Option auf |
| boolean |
| Dieser Parameter gibt an, ob "SubSampling" verwendet werden soll. |
Wasserzeichen
Bei der automatischen Bearbeitung und Prüfung von Bilddateien kann der Content-Server Wasserzeichen setzen. Dies sind Bilder oder Bildausschnitte, die als eine Art Identitätsinformation (des Urhebers) in das bearbeitete Bild eingesetzt werden. Wasserzeichen können mit dem Element watermark
konfiguriert werden und folgende Parameter enthalten:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| boolean |
| Dieser Parameter gibt an, ob Wasserzeichen verwendet werden sollen. |
| string | Dieser Parameter gibt den Pfad zu einer weiteren Konfigurationsdatei für die Informationen im Wasserzeichen an. | |
| boolean |
| Dieser Parameter gibt an, ob Wasserzeichen skaliert werden sollen. |
| integer |
| Dieser Parameter gibt an, auf welche Größe (in Prozent) das Wasserzeichen skaliert werden soll. |
| boolean |
| Dieser Parameter kann auf |
Fehler-Wasserzeichen können verwendet werden, um Fehler in Dokumenten nicht auf einer folgenden Fehler-Webseite anzugezeigen, sondern als Wasserzeichen (=Overlay) direkt in den Bilddateien einzusetzen. Diese können mit dem Element errorWaterMark
konfiguriert werden und folgende Parameter enthalten:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| string | Dieser Parameter gibt den Titel an, der in einem Fehler-Wasserzeichen stehen soll. | |
| integer | Dieser Parameter gibt an, welche Schriftgröße der Titel eines Fehler-Wasserzeichen haben soll. | |
| integer |
| Dieser Parameter gibt an, welche Schriftgröße die Fehlermeldung ( |
| integer |
| Dieser Parameter gibt an, wie viele Zeichen maximal in einer Zeile der Fehlermeldung eines Fehler-Wasserzeichens stehen sollen. |
PDF Titelseiten
Der Content-Server kann drei verschiedene Arten von künstlichen Titelseiten generieren und an passenden Stellen in mehrseitigen PDF-Dateien einsetzen. Künstliche Titelseiten sind Seiten, die einige Metainformationen über das danach folgende Dokument bzw. Kapitel oder Dokumentabschnitt enthalten. Metadaten werden aus METS-Dateien des entsprechenden Vorgangs gelesen. Zusätzlich ist es auch möglich, in der METS-Datei verlinkte Bildinhalte anzuzeigen. Das Layout sowie statische Inhalte der Metadatenseiten werden durch XML-Dokumente, sogenannte Templates, vorgegeben, die nach individuellen Bedürfnissen angepasst werden können.
Mit pdfTitlePage
kann eine einmalig generierte Titelseite für das gesamte PDF-Dokument generiert werden. Sie wird vor der ersten Seite eingefügt und kann nur Informationen zum Gesamtwerk und zum obersten in der PDF-Datei enthaltenen Strukturelement enthalten.
Mit dem Element pdfChapterTitlePages
können Titelseiten vor jedem Kapitel bzw. vor jedem Strukturelement eingefügt werden und können Informationen über das jeweilige Strukturelement und das Gesamtwerk enthalten. Diese Seiten können zum Beispiel Informationen über die Dokumentstruktur (Inhaltsverzeichnisse, Kapitel, Unterkapitel, Anhänge, usw.) enthalten.
Mit dem Element singlePdfTitlePage
können weitere, individuelle Titelseiten in das PDF-Dokument eingebunden werden, die Informationen über besondere Stellen in z.B. einem Buch angeben. Sie kann nur Informationen über das Gesamtwerk enthalten.
Für die Generierung von zusätzlichen PDF-Titelseiten können .fo
-Vorlagendateien verwendet werden. Diese können entweder in Server-Anfragen angegeben oder in den folgenden XML-Elementen angegeben werden.
Die angegebenen Ordner (templateFolder
) müssen zumindest für jede aktive Metadatenseite die in defaultTemplate
angegebene XML-Datei mit Dateiendung .fo
enthalten, sowie die Datei fop.xconf
, die weitere Einstellungen für die Konvertierung zur PDF-Datei mittels "Apache fop" beinhaltet. Details zu "Apache fop" sind an dieser Stelle zu finden.
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| boolean |
| Dieser Parameter kann bei allen Arten von Titelseiten verwendet werden und gibt an, ob diese verwendet werden soll. |
| string |
| Dieser Parameter kann bei allen Arten von Titelseiten verwendendet werden und gibt einen Ordner an, in dem sich eine Vorlagendatei befindet. |
| string |
| Dieser Parameter kann bei allen Arten von Titelseiten verwendet werden und gibt eine (vom Standard abweichende) Vorlage an, die verwendet werden soll. Eine Vorlagendatei hat die Dateiendung |
| string | Dieser Parameter kann nur bei | |
| string | Dieser Parameter kann nur bei |
REST API
Mit der REST-API können Informationen über Bilddateien am Content-Server abgefragt werden. Die Parameter attribution
, logo
und license
sind zusätzliche Angaben, die optional in den Bildmetadaten der zurückgesendeten Bilddateien gesetzt werden können.
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| boolean |
| Mit diesem Parameter kann angegeben werden, ob die REST-API verwendet werden soll. |
| string | Dieser Wert beinhaltet Informationen über eine IIIF-Zuschreibung. | |
| string | Dieser Wert beinhaltet Informationen über ein IIIF-Logo. | |
| string | Dieser Wert beinhaltet Informationen über eine IIIF-Lizenz. | |
| boolean |
| Dieser Wert kann auf |
Cache-Speicher
Mit Cache-Speichern können Bilddaten zwischengespeichert werden, um nicht für jede (möglicherweise identische) Anfrage sämtliche Daten neu berechnen zu müssen. Für die Verarbeitung verschiedener Dateitypen werden verschiedene Caches verwendet, die mit den folgenden XML-Elementen näher konfiguriert werden können. Dabei kann mit dem Element contentCache
ein allgemeiner Cache für Bilddateien, mit dem Element pdfCache
ein Cache für PDF-Dateien und mit dem Element thumbnailCache
ein Cache für Vorschaubilder verwendet werden.
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| boolean |
| Dieser Parameter kann bei allen Cache-Arten verwendet werden und gibt an, ob der jeweilige Cache verwendet werden soll. |
| long |
| Dieser Parameter kann bei allen Cache-Arten verwendet werden und gibt die maximale Größe in Megabyte des jeweiligen Caches an. |
| boolean |
| Dieser Parameter kann bei allen Cache-Arten verwendet werden und gibt an, ob verkürzte Dateinamen verwendet werden sollen. Diese beinhalten dann nur abweichende Bestandteile des Dateipfades, werden allerdings nicht empfohlen. |
| string | Dieser Parameter kann bei | |
| boolean |
| Dieser Parameter kann nur bei |
Performanz
Mit dem Element memoryUsage
können einige Speicher- und Laufzeitbeschränkungen für den Content-Server angegeben werden. Dabei beinhaltet das Element memoryUsage
allgemeine Einstellungen und weitere Unterelemente für bestimmte Dateitypen. Für memoryUsage
können folgende Parameter verwendet werden:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| integer |
| Dieser Parameter gibt an, wie viele Anfragen gleichzeitig für Bilddateien gesendet werden dürfen. |
| integer |
| Dieser Parameter gibt an, wie viele Anfragen gleichzeitig für PDF-Dateien gesendet werden dürfen. |
| long |
| Dieser Parameter gibt an, wie lange die Datenübertragung aller Dateitypen maximal dauern darf. |
| string |
| Dieser Parameter gibt die Maßeinheit für die Speichergrößenangaben in allen |
| string |
| Dieser Parameter gibt die Maßeinheit für die Zeitangaben in allen |
| boolean |
| Dieser Parameter kann auf |
Für den Parameter memoryUnit
gibt es einige, teils missverständliche, Werte. In der folgenden Tabelle ist jeweils angegeben, welche Werte verwendet werden können und welchen genauen numerischen Werten sie intern entsprechen.
Maßeinheit | Faktor | Bezeichnung |
---|---|---|
|
| Byte |
|
| Kilobyte |
|
| Kibibyte |
|
| Megabyte |
|
| Mebibyte |
|
| Gigabyte |
|
| Gibibyte |
|
| Terabyte |
|
| Tebibyte |
Für den Parameter timeoutUnit
gibt es ebenfalls einige mögliche Werte. In der folgenden Tabelle ist jeweils angegeben, wie diese intern interpretiert werden:
Maßeinheit | Faktor | Bezeichnung |
---|---|---|
|
| Eine Sekunde |
|
| Eine Millisekunde |
|
| Eine Mikrosekunde |
|
| Eine Nanosekunde |
Mit den Unterelementen image
, pdf
und metsPdf
können spezielle Einstellungen für die entsprechenden Dateitypen vorgenommen werden. Folgende Parameter können bei allen Unterelementen gleichermaßen verwendet werden:
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| integer |
| Dieser Wert gibt die maximale Anzahl an parallelen Anfragen an, die gleichzeitig gestellt werden dürfen. |
| long |
| Dieser Wert gibt an, wie viele Daten maximal gleichzeitig gesendet werden sollen. Dieser Wert muss passend zum |
| long |
| Dieser Wert gibt an, wie lange die Datenübertragung maximal dauern darf. Dieser Wert muss passend zum |
S3-Speicher
Mit dem Element S3
kann optional ein S3-Cloud-Speicher eingebunden werden, um Daten auszulagern.
Eigenschaft | Typ | Standardwert | Beschreibung |
---|---|---|---|
| boolean | Mit diesem Wert kann festgelegt werden, ob ein S3-Speicher verwendet werden soll. | |
| string | Dieser Wert gibt die Adresse (URL) des S3-Servers an. Gegebenenfalls muss auch das Protokoll ( | |
| string | Dieser Wert gibt die ID des Accounts am S3-Service an. | |
| string | Dieser Wert gibt den Schlüssel / Passwort des S3-Accounts an. |
Zuletzt aktualisiert