Links

1.3 Ordnerkonfiguration

Der Goobi viewer enthält verschiedene Ordnerkonfigurationen, die im Folgenden näher erläutert sind.
config_viewer.xml
<configFolder>/opt/digiverso/viewer/config/</configFolder>
<viewerHome>/opt/digiverso/viewer/</viewerHome>
<dataRepositoriesHome>/opt/digiverso/viewer/data/</dataRepositoriesHome>
<indexedMetsFolder>indexed_mets</indexedMetsFolder>
<indexedLidoFolder>indexed_lido</indexedLidoFolder>
<indexedDenkxwebFolder>indexed_lido</indexedDenkxwebFolder>
<indexedDublinCore>indexed_dublincore</indexedDublinCore>
<mediaFolder>media</mediaFolder>
<origContentFolder>source</origContentFolder>
<pdfFolder>pdf</pdfFolder>
<cmsMediaFolder>cms_media</cmsMediaFolder>
<cmsTextFolder>cms</cmsTextFolder>
<altoFolder>alto</altoFolder>
<altoCrowdsourcingFolder>alto_crowd</altoCrowdsourcingFolder>
<abbyyFolder>abbyy</abbyyFolder>
<fulltextFolder>fulltext</fulltextFolder>
<fulltextCrowdsourcingFolder>fulltext_crowd</fulltextCrowdsourcingFolder>
<teiFolder>tei</teiFolder>
<cmdiFolder>cmdi</cmdiFolder>
<annotationFolder>annotations</annotationFolder>
<hotfolder>/opt/digiverso/viewer/hotfolder/</hotfolder>
<stopwordsFile>/opt/digiverso/solr/solr/server/solr/configsets/goobiviewer/conf/lang/stopwords.txt</stopwordsFile>
Die Parameter sind in der folgenden Tabelle im einzelnen erklärt:
Option
Bedeutung
configFolder
Der Parameter configFolder enthält den Pfad zum lokalen Konfigurationsordner. Dieser enthält angepasste Konfigurations- und Übersetzungsdateien, die die Standardkonfiguration überschreiben.
viewerHome
Das Verzeichnis viewerHome ist der Basispfad des Goobi viewers, relativ zu welchem weitere Verzeichnisse gesucht werden.
dataRepositoriesHome
Das Verzeichnis dataRepositoriesHome ist der Pfad, relativ zu dem die einzelnen Repository-Ordner gesucht werden. Die Information, ob ein Werk eine Datenrepository verwendet oder die klassische Ordnerstruktur liegt im Index und wird vom Goobi viewer automatisch ausgewertet.
indexedMetsFolder
Das Verzeichnis indexedMetsFolder enthält die METS-Dateien, die erfolgreich indexiert wurden. Aus diesem Ordner bezieht der METS-Resolver die ausgelieferten METS-Dateien. Dieses Verzeichnis wird relativ zu dataRepositoriesHome beziehungsweise zu viewerHome gesucht. Aus diesem Grund darf der Wert nur den Namen und keinen absoluten Pfad enthalten.
indexedLidoFolder
Das Verzeichnis indexedLidoFolder enthält die LIDO-Dateien, die erfolgreich indexiert wurden. Aus diesem Ordner bezieht der LIDO-Resolver die ausgelieferten LIDO-Dateien. Dieses Verzeichnis wird relativ zu dataRepositoriesHome beziehungsweise zu viewerHome gesucht. Aus diesem Grund darf der Wert nur den Namen und keinen absoluten Pfad enthalten.
indexedDenkxwebFolder
Das Verzeichnis indexedDenkxwebFolder enthält die DenkXweb Dateien, die erfolgreich indexiert wurden. Aus diesem Ordner bezieht der Resolver die ausgelieferten DenkXweb Dateien. Dieses Verzeichnis wird relativ zu dataRepositoriesHome beziehungsweise zu viewerHome gesucht. Aus diesem Grund darf der Wert nur den Namen und keinen absoluten Pfad enthalten.
indexedDublinCoreFolder
Das Verzeichnis indexedDublinCoreFolder enthält die Dublin Core Dateien, die erfolgreich indexiert wurden. Aus diesem Ordner bezieht der Resolver die ausgelieferten Dublin Core Dateien. Dieses Verzeichnis wird relativ zu dataRepositoriesHome beziehungsweise zu viewerHome gesucht. Aus diesem Grund darf der Wert nur den Namen und keinen absoluten Pfad enthalten.
mediaFolder
Das Verzeichnis mediaFolder enthält Mediendateien für die Darstellung im Goobi viewer (Bild-, Audio- und Videodateien). Dieses Verzeichnis wird relativ zu dataRepositoriesHome beziehungsweise zu viewerHome gesucht. Aus diesem Grund darf der Wert nur den Namen und keinen absoluten Pfad enthalten.
origContentFolder
Im origContentFolder befinden sich sonstige, zum Werk gehörende Dateien, die innerhalb der Werksanzeige zum Download bereitgestellt werden (zum Beispiel Born-Digital Materialien).
pdfFolder
Im pdfFolder befinden sich vorgerenderte PDF-Dateien
cmsMediaFolder
Ordner, in dem für die CMS-Seiten hochgeladenen Mediendateien (zum Beispiel Bilder) abgelegt werden. Standardwert ist cms_media.
cmsTextFolder
Der cmsTextFolder enthält extrahierte Texte von CMS-Seiten für die Indexierung.
altoFolder
abbyyFolder
fulltextFolder
teiFolder
cmdiFolder
Der Goobi viewer ist in der Lage, die originalen OCR Dateien die für die Indexierung verwendet wurden, auszuliefern. Die entsprechenden Verzeichnisse werden respektive unter altoFolder, abbyyFolder , fulltextFolder, teiFolder und cmdiFolder konfiguriert.
altoCrowdsourcingFolder fulltextCrowdsourcingFolder
Hier können Ordner für ALTO- und Plaintext-Dateien konfiguriert werden, die mit dem Crowdsourcing-Modul transkribiert wurden. Existiert für die angeforderte Seite eine Datei aus dem Crowdsourcing, wird diese vorzugsweise statt der Originaldatei geladen.
annotationFolder
Wurden im Rahmen einer Crowdsourcing Kampagne Annotationen erstellt, werden diese als JSON WebAnnotation im annotationFolder gespeichert.
hotfolder
Soll ein Werk, oder Teile eines Werkes neu indexiert werden, müssen die Informationen dafür im Hotfolder des Goobi viewer Indexers platziert werden. Das Verzeichnis für den Hotfolder wird unter hotfolder konfiguriert.
stopwordsFile
Der absolute Pfad zu der Stopwords-Datei für den Solr Suchindex wird im Element stopwordsFile konfiguriert. Damit ist es möglich Stopwörter aus den Suchtreffern heraus zu filtern.