2.1 Hauptkonfiguration
Die Hauptkonfiguration sieht standardmäßig wie folgt aus:
config_indexer.xml
1
<init>
2
<sleep>1000</sleep>
3
<minStorageSpace>2048</minStorageSpace>
4
<solrUrl>http://localhost:8983/solr/collection1</solrUrl>
5
<!-- <oldSolrUrl>http://localhost:8080/solr/collection1</oldSolrUrl> -->
6
<viewerUrl>http://localhost:808/viewer/</viewerUrl>
7
<viewerAuthorizationToken>CHANGEME</viewerAuthorizationToken>
8
<deleteContentFilesOnFailure>true</deleteContentFilesOnFailure>
9
<addVolumeCollectionsToAnchor>false</addVolumeCollectionsToAnchor>
10
<namespaces>
11
<!--
12
<list>
13
<xyz>http://www.example.org/xyz/</xyz>
14
</list>
15
-->
16
</namespaces>
17
<pageCountStart>1</pageCountStart>
18
<addLabelToChildren>true</addLabelToChildren>
19
<labelCleanup>true</labelCleanup>
20
<addNormDataFieldsToDefault>
21
<field>NORM_IDENTIFIER</field>
22
<field>NORM_NAME</field>
23
<field>NORM_ALTNAME</field>
24
</addNormDataFieldsToDefault>
25
<aggregateRecords>true</aggregateRecords>
26
<fulltextForceUTF8>true</fulltextForceUTF8>
27
<lido>
28
<imageXPath>lido:resourceRepresentation[@lido:type='image_master']/lido:linkResource</imageXPath>
29
<imageXPath>lido:resourceRepresentation[@lido:type='http://terminology.lido-schema.org/resourceRepresentation_type/provided_representation']/lido:linkResource</imageXPath>
30
<imageXPath>lido:resourceRepresentation[@lido:type='http://terminology.lido-schema.org/lido00464']/lido:linkResource</imageXPath>
31
<imageXPath>lido:resourceRepresentation[@lido:type='image_overview']/lido:linkResource</imageXPath>
32
<imageXPath>lido:resourceID</imageXPath>
33
</lido>
34
<email>
35
<recipients>[email protected]</recipients>
36
<smtpServer>localhost</smtpServer>
37
<smtpUser></smtpUser>
38
<smtpPassword></smtpPassword>
39
<smtpSenderAddress>[email protected]</smtpSenderAddress>
40
<smtpSenderName>Goobi viewer Indexer</smtpSenderName>
41
<smtpSecurity>NONE</smtpSecurity>
42
</email>
43
</init>
Copied!
Die Parameter sind in der folgenden Tabelle im einzelnen erklärt:
Option
Bedeutung
sleep
Wartezeit des Goobi viewer Indexers (in Millisekunden) zwischen Überwachungszyklen des Hotfolders. Standardwert ist 3000.
minStorageSpace
Minimum an freiem Festplattenspeicher (in MB) auf dem Laufwerk, auf dem sich der Hotfolder befindet, um indexieren zu können.
Sollte diese Größe unterschritten werden, beendet sich der Goobi viewer Indexer automatisch und muss (nach Vergrößerung des verfügbaren Speichers) manuell neu gestartet werden. Standardwert ist 2048.
solrUrl
URL des Apache Solr Servers, der den Index enthält. Sämtliche Kommunikation zwischen dem Goobi viewer Indexer und Solr erfolgt über HTTP Queries.
oldSolrUrl
Sofern bei einer kompletten Neuindexierung bestimmte Felder aus einem alten Solr Index in den neuen übernommen werden sollen, muss in diesem Element die URL zum alten Solr stehen. Die übernommenen Felder sind DATECREATED, DATEUPDATED und THUMBNAILREPRESENT. Bei Anchor Werken kommt noch die IDDOC hinzu. Liegen die Werke in einem DATAREPOSITORY, wird die Information über die Zugehörigkeit ebenfalls mit portiert.
Dieser Schalter wurde mit der Version 4.8.0 eingeführt um die Migration von Solr 4 zu Solr 8 zu ermöglichen. In einer regulären Installation wird dieses Element nicht benötigt.
viewerUrl
URL zum Goobi viewer damit zum Beispiel beim Neuindexieren eines Werkes automatisch alte Bilder aus dem Cache entfernt werden.
deleteContentFilesOnFailure
Es kann vorkommen, dass die Indexierung eines Objektes etwa durch eine fehlerhafte XML Datei fehlschlägt. In einem solchen Fall werden die Datei und alle dazugehörigen Ordner (Medien, Volltexte, Wordkoordinaten, etc.) aus dem Hotfolder entfernt. Je nach Objekt kann es aber vorkommen, dass die dazugehörigen Ordner große Datenmengen enthalten, so dass das Kopieren dieser Daten in den Hotfolder sehr viel Zeit in Anspruch nimmt. In solchen Fällen gibt es die Möglichkeit, diese Ordner auch bei Scheitern im Hotfolder zu belassen, damit diese mit einer korrigierten XML Datei verwendet werden können. Das Verbleiben dieser Ordner im Hotfolder hat keinen Einfluss auf die Indexierung etwaiger anderer Objekte.
addVolumeCollectionsToAnchor
Bei der Indexierung von mehrbändigen Werken kann es vorkommen, dass Bände unterschiedlichen Sammlungen angehören. Wenn dieses Element auf true steht, werden Sammlungsnamen aus allen im Index enthaltenen Bänden auch in das Gesamtwerk kopiert (Sammlungen, denen nur das Gesamtwerk angehört, bleiben ebenfalls erhalten). Zu beachten ist hier, dass evtl. Schreibfehler bei Sammlungsnamen nicht mehr automatisiert aus dem Gesamtwerk entfernt werden können, wenn diese Option aktiviert ist. Standardwert ist false.
namespaces
Werden in METS Dokumenten zusätzliche XML Namespaces eingebettet, müssen diese dem Goobi viewer Indexer mitgeteilt werden, damit entsprechende XPath Ausdrücke ausgewertet werden können. Der Namespace Name wird dabei als Elementname innerhalb des Elements definiert, die Namespace URI als Textwert dieses Elements.
Sind keine zusätzlichen Namespaces definiert, darf kein leeres Element <list> vorhanden sein.
pageCountStart
Der Goobi viewer erwartet eine Seitenzählung, die bei 1 anfängt. Um einer stetigen Abweichung in der Seitennavigation entgegenzuwirken, kann die Kompatibilität zu älteren Goobi viewer Versionen hergestellt werden, indem der Wert auf 0 gesetzt wird. Standardwert ist 1.
addLabelToChildren
Steht dieser Schalter auf true, werden die Werte der LABEL-Felder von Strukturelementen in das DEFAULT-Feld von untergeordnenten Strukturelementen geschrieben. Standardwert ist false.
labelCleanup
Steht dieser Schalter auf true, werden Nichtsortierzeichen-Sequenzen "<ns></ns>", "<<>>" und "¬" aus dem Wert entfernt. Standardwert ist false.
addNormDataFieldsToDefault/field
Werte bestimmte Normdatenfelder (zum Beispiel alternative Schreibweisen eines Namen) können zum DEFAULT-Suchfeld hinzugefügt werden, um direkte Suchbarkeit zu gewährleisten. Hierzu wird für jedes gewünschte Feld ein neues Konfigurationselement hinzugefügt (zum Beispiel <field>NORM_ALTNAME</field>).
aggregateRecords
Wenn auf true gesetzt, werden die für die aggregierte Suche notwendigen Zusatzfelder (etwa aggregierte Volltexte und Metadaten) in den Index geschrieben. Standardwert ist false.
fulltextForceUTF8
Wenn auf true gesetzt, werden Volltexte automatisch nach UTF-8 konvertiert, wenn ein anderer Charset erkannt wird. Standardwert ist true.
lido/imageXPath
Um die Heterogenität Image-Pfade in LIDO-Dokumenten zu berücksichtigen, sind die möglichen XPath-Ausdrücke (relativ zu lido:resourceSet), in denen Bildverlinkungen gesucht werden, konfigurierbar. Die Liste wird von oben nach unten abgearbeitet, und der erste Ausdruck, der Treffer liefert, wird verwendet (die restlichen werden ignoriert).
email/...
Sofern bei der Indexierung Fehler auftreten kann der Goobi viewer Indexer die im Element recipients definierten Emailadressen benachrichtigen. Die Konfiguration erfolgt analog zu der in Kapitel 1.5.2 beschriebenen Weise.
viewerAuthorizationToken
Damit beim Verschieben von Datensätzen zwischen DataRepositories der Goobi viewer über die Änderung informiert werden kann, wird ein Token benötigt. Der Token wird in der config_viewer.xml hinterlegt. Sie dazu auch Kapitel 1.33.3.
Last modified 2mo ago
Copy link