3.1 Hauptkonfiguration

solr_indexerconfig.xml
<init>
<sleep>1000</sleep>
<minStorageSpace>2048</minStorageSpace>
<solrUrl>http://localhost:8080/solr/collection1</solrUrl>
<viewerUrl>http://localhost:808/viewer/</viewerUrl>
<deleteContentFilesOnFailure>true</deleteContentFilesOnFailure>
<addVolumeCollectionsToAnchor>false</addVolumeCollectionsToAnchor>
<namespaces>
<!-- <list> </list> -->
</namespaces>
<pageCountStart>1</pageCountStart>
<addLabelToChildren>true</addLabelToChildren>
<labelCleanup>true</labelCleanup>
<addNormDataFieldsToDefault>
<field>NORM_IDENTIFIER</field>
<field>NORM_NAME</field>
<field>NORM_ALTNAME</field>
</addNormDataFieldsToDefault>
<aggregateRecords>true</aggregateRecords>
<lido>
<imageXPath>lido:resourceRepresentation[@lido:type='image_master']/lido:linkResource</imageXPath>
<imageXPath>lido:resourceRepresentation[@lido:type='http://terminology.lido-schema.org/resourceRepresentation_type/provided_representation']/lido:linkResource</imageXPath>
<imageXPath>lido:resourceRepresentation[@lido:type='http://terminology.lido-schema.org/lido00464']/lido:linkResource</imageXPath>
<imageXPath>lido:resourceRepresentation[@lido:type='image_overview']/lido:linkResource</imageXPath>
<imageXPath>lido:resourceID</imageXPath>
</lido>
<email>
<recipients>admin@example.org</recipients>
<smtpServer>localhost</smtpServer>
<smtpUser></smtpUser>
<smtpPassword></smtpPassword>
<smtpSenderAddress>do-not-reply@goobi-viewer.example.org</smtpSenderAddress>
<smtpSenderName>Goobi viewer Indexer</smtpSenderName>
<smtpSecurity>NONE</smtpSecurity>
</email>
<viewerAuthorizationToken>CHANGEME</viewerAuthorizationToken>
</init>

3.1.1 Parameter: sleep

Wartezeit des Goobi viewer Indexers (in Millisekunden) zwischen Überwachungszyklen des Hotfolders. Standardwert ist 3000.

3.1.2 Parameter: minStorageSpace

Minimum an freiem Festplattenspeicher (in MB) auf dem Laufwerk, auf dem sich der Hotfolder befindet, um indexieren zu können.

Sollte diese Größe unterschritten werden, beendet sich der Goobi viewer Indexer automatisch und muss (nach Vergrößerung des verfügbaren Speichers) manuell neu gestartet werden. Standardwert ist 2048.

3.1.3 Parameter: solrUrl

URL des Apache Solr HTTP Servers, der den Index enthält. Sämtliche Kommunikation zwischen dem Goobi viewer Indexer und Solr erfolgt über HTTP Queries.

3.1.4 Parameter: viewerUrl

URL zum Goobi viewer damit zum Beispiel beim Neuindexieren eines Werkes automatisch alte Bilder aus dem Cache entfernt werden.

3.1.5 Parameter: deleteContentFilesOnFailure

Es kann vorkommen, dass die Indexierung eines Objektes etwa durch eine fehlerhafte XML Datei fehlschlägt. In einem solchen Fall werden die Datei und alle dazugehörigen Ordner (Medien, Volltexte, Wordkoordinaten, etc.) aus dem Hotfolder entfernt. Je nach Objekt kann es aber vorkommen, dass die dazugehörigen Ordner große Datenmengen enthalten, so dass das Kopieren dieser Daten in den Hotfolder sehr viel Zeit in Anspruch nimmt. In solchen Fällen gibt es die Möglichkeit, diese Ordner auch bei Scheitern im Hotfolder zu belassen, damit diese mit einer korrigierten XML Datei verwendet werden können. Das Verbleiben dieser Ordner im Hotfolder hat keinen Einfluss auf die Indexierung etwaiger anderer Objekte.

3.1.6 Parameter: addVolumeCollectionsToAnchor

Bei der Indexierung von mehrbändigen Werken kann es vorkommen, dass Bände unterschiedlichen Kollektionen angehören. Wenn dieses Element auf true steht, werden Kollektionsnamen aus allen im Index enthaltenen Bänden auch in das Gesamtwerk kopiert (Kollektionen, denen nur das Gesamtwerk angehört, bleiben ebenfalls erhalten). Zu beachten ist hier, dass evtl. Schreibfehler bei Kollektionsnamen nicht mehr automatisiert aus dem Gesamtwerk entfernt werden können, wenn diese Option aktiviert ist. Standardwert ist false.

3.1.7 Parameter: namespaces

Werden in METS Dokumenten zusätzliche XML Namespaces eingebettet, müssen diese dem Goobi viewer Indexer mitgeteilt werden, damit entsprechende XPath Ausdrücke ausgewertet werden können. Der Namespace Name wird dabei als Elementname innerhalb des Elements <list> definiert, die Namespace URI als Textwert dieses Elements:

solr_indexerconfig.xml
<init>
<namespaces>
<list>
<xyz>http://www.example.org/xyz/</xyz>
</list>
</namespaces>
<init>

Sind keine zusätzlichen Namespaces definiert, darf kein leeres Element <list> vorhanden sein.

3.1.8 Parameter: pageCountStart

Seit Dezember 2014 erwartet der Goobi viewer eine Seitenzählung, die bei 1 anfängt. Versionen davor hingegen fangen mit der Zählung bei 0 an. Um einer stetigen Abweichung in der Seitennavigation entgegenzuwirken, kann die Kompatibilität zu älteren Goobi viewer Versionen hergestellt werden, indem der Wert auf 0 gesetzt wird. Standardwert ist 1.

3.1.9 Parameter: addLabelToChildren

Steht dieser Schalter auf true, werden die Werte der LABEL-Felder von Strukturelementen in das DEFAULT-Feld von untergeordnenten Strukturelementen geschrieben. Standardwert ist false.

3.1.10 Parameter: labelCleanup

Steht dieser Schalter auf true, werden Nichtsortierzeichen-Sequenzen "<ns></ns>", "<<>>" und "¬" aus dem Wert entfernt. Standardwert ist false.

3.1.11 Parameter: addNormDataFieldsToDefault/field

Werte bestimmte Normdatenfelder (zum Beispiel alternative Schreibweisen eines Namen) können zum DEFAULT-Suchfeld hinzugefügt werden, um direkte Suchbarkeit zu gewährleisten. Hierzu wird für jedes gewünschte Feld ein neues Konfigurationselement hinzugefügt (zum Beispiel <field>NORM_ALTNAME</field>).

3.1.12 Parameter: aggregateRecords

Wenn auf true gesetzt, werden die für die aggregierte Suche notwendigen Zusatzfelder (etwa aggregierte Volltexte und Metadaten) in den Index geschrieben. Standardwert ist false.

3.1.13 Parameter: lido/imageXPath

Um die Heterogenität Image-Pfade in LIDO-Dokumenten zu berücksichtigen, sind die möglichen XPath-Ausdrücke (relativ zu lido:resourceSet), in denen Bildverlinkungen gesucht werden, konfigurierbar. Die Liste wird von oben nach unten abgearbeitet, und der erste Ausdruck, der Treffer liefert, wird verwendet (die restlichen werden ignoriert).

3.1.14 Parameter: email/...

Sofern bei der Indexierung Fehler auftreten kann der Goobi viewer Indexer die im Element recipients definierten Emailadressen benachrichtigen. Die Konfiguration erfolgt analog zu der in Abschnitt 2.5.2 beschriebenen Weise.

3.1.15 Parameter viewerAuthorizationToken

Damit beim Verschieben von Datensätzen zwischen DataRepositories der Goobi viewer über die Änderung informiert werden kann, wird ein Token benötigt. Der Token wird in der config_viewer.xml hinterlegt. Sie dazu auch Kapitel 2.33.3.