2.11 Solr Schema
Allgemein
Das vom Goobi viewer Indexer und Goobi viewer Core verwendete Solr Schema befindet sich im Git Repository des Goobi viewer Indexers:
Feldtypen
Im Schema selbst gibt es verschiedene Arten von Feldern. Diese sind im folgenden erklärt
Feldtyp
Beispiel
Verwendung und Konfiguration
statisch (fix)
DOCSTRCT, NUMPAGES
Diese Felder können nicht konfiguriert werden. Sie werden vom Goobi viewer Indexer automatisch geschrieben.
statisch (konfigurierbar)
PI, CURRENTNO
Diese Felder haben einen statischen Namen. Der Inhalt kann allerdings via XPATH über die Konfigurationsdatei des Goobi viewer Indexers konfiguriert werden.
MD_
MD_TITLE
Alle Felder, die mit MD_ beginnen, können in der Goobi viewer Indexer Konfigurationsdatei frei konfiguriert werden. Es können alle Arten von Werten gespeichert werden. Je nach Feldkonfiguratioon werden auch Sortierfelder, Felder für die Facettierung, Untokenized Felder etc. geschrieben.
MD2_
MD2_DESCRIPTION
Funktioniert genauso wie MD_. Der Zweck dieses alternativen Musters ist, bestimmte Felder auf Wunsch von eine pauschalen Auslieferung auszuschließen (etwa wenn alle MD_* Felder über eine Schnittstelle ausgeliefert werden).
MDNUM_
MDNUM_PUBLICRELEASEYEAR
Funktioniert wie MD_, allerdings ist der Datentyp kein String, sondern ein Long, um etwa numerische Sortierung zu gewährleisten.
BOOL_
BOOL_DIRECTION_RTL
Alle Felder die mit BOOL_ beginnen, können in der Goobi viewer Indexer Konfigurationsdatei frei konfiguriert werden. Es können nur Booleans (true|false) gespeichert werden. Diese können, wenn sie in dem Quelldokument stehen direkt übernommen werden. Alternativ kann im XPATH-Ausdruck über boolean(string(...)) ein Boolean sichergestellt werden.
SORT_
SORT_TITLE
Felder mit SORT_ können direkt in der Konfigurationsdatei konfiguriert werden. Das ist zum Beispiel sinnvoll, wenn der Sortiertitel bereits explizit in den Metadaten ausgewiesen wird. Ansonsten kann der Schalter addSortField gesetzt werden, damit für ein Metadatum ein Sortierfeld geschrieben wird. Sortierfelder dürfen nur einen Wert enthalten. Die Felder stehen dann zum Beispiel für die Sortierung von Suchtreffern zur Verfügung.
FACET_
FACET_PLACEPUBLISH
Sonderform von Metadatenfelder, die zur effizienteren Facettierung herangezogen wird. Felder CENTURY, YEAR, DC, DOCSTRUCT, DOCSTRUCT_*, MD_* und MD_* werden automatisch als eine FACET_* Kopie angelegt. Konfiguriert wird für die Facettierung der ursprüngliche Feldname, und die FACET_* Variante wird automatisch verwendet.
_UNTOKENIZED
MD_TITLE_UNTOKENIZED
Felder mit dem Suffix _UNTOKENIZED dürfen in der Konfigurationsdatei nicht direkt konfiguriert werden. Die Felder werden zum Beispiel in der Stöbern-Funktion benötigt. Ob ein _UNTOKENIZED Feld geschrieben wird, wird über den Schalter addUntokenizedVersion gesteuert.
_LANG_XX
MD_TITLE_LANG_DE
Felder mit LANG_XX können als Suffix zu MD_ Feldern frei definiert werden. Dabei muss XX gegen ein valides Sprachkürzel ausgetauscht werden, zum Beispiel DE, EN, FR oder ES. Wenn im Solr Index Werte in Feldern mit _LANG_XX Suffix stehen, wertet der Goobi viewer Core diese aus und unterstützt dann nicht nur die Mehrsprachigkeit in der Oberfläche, sondern auch für die Metadatenwerte.
NORM_
NORM_ALTNAME
Suchbare Medatenfelder, die aus Normdatensätzen importiert wurden.
GROUPID_ / GROUPORDER_
GROUPID_SERIES, GROUPORDER_SERIES
Felder, die Gruppenzugehörigkeit (etwa zu einer Bandserie) beschreiben. GROUPID_ enthält dabei den Identifier des Gruppe, GROUPORDER_ die Sortierreihenfolge des betreffenden Werks in dieser Gruppe. Der Wert hinter dem Unterstrich muss
DATE_
DATE_PUBLICRELEASE
Felder mit dem Solr-Datentype TrieDateField speichern Zeitstempel (YYYY-MM-DDThh:mm:ssZ). Für künftige Anwendungsszenarien.
spezielle Felder
Einige Felder im Suchindex werden im Goobi viewer Core statisch referenziert um bestimmte Funktionen zur Verfügung zu stellen. Diese sind in der folgenden Matrix aufgeführt:
Solr-Feldname
gespeicherte Information
COinS
HighWire Press
DublinCore
RIS
MD_TITLE
Titel des Werkes
rft.title
citation_title
DC.title
TI
MD_ALTERNATETITLE
Alternativtitel
-/-
-/-
-/-
J2
MD_CREATOR
Name des Autors
rft.au
citation_author
DC.creator
AU
MD_EDITOR
Name des Editors
-/-
-/-
-/-
ED
MD_CORPORATION
Körperschaft
rft.aucorp
-/-
-/-
-/-
MD_ISBN
ISBN-Nummer
rft.isbn
citation_isbn
-/-
SN
MD_ISSN
ISSN-Nummer
rft.issn
citation_issn
-/-
SN
MD_YEARPUBLISH
Erscheinungs-jahr
rft.date
citation_publication _date
DC.date
PY
MD_PUBLISHER
Verlag
rft.pub
-/-
DC.publisher
PB
MD_PLACEPUBLISH
Erscheinungsort
rft.place
-/-
-/-
PP
MD_EDITION
Edition
rtf.edition
-/-
-/-
ET
MD_SERIES
Serie
rft.series
-/-
-/-
-/-
MD_SUBJECT
Schlagwort
rft.subject
-/-
-/-
-/-
MD_LANGUAGE
Sprache
rft.language
citation_language
DC.language
LA
CURRENTNO
Bandnummer
-/-
citation_volume
-/-
VL
MD_INFORMATION
Abstract zum Werk
-/-
description
DCTERMS.abstract
AB
MD_NOTE
Generische Notiz
-/-
-/-
-/-
N1
MD_GEOKEYWORD
Geographisches Schlagwort
-/-
-/-
-/-
KW
MD_PERSONKEYWORD
Personen-schlagwort
-/-
-/-
-/-
KW
MD_WORKKEYWORD
Werkschlagwort
-/-
-/-
-/-
KW
URN
URN des Werkes
-/-
-/-
DC.identifier
-/-
ACCESSCONDITION
Zugriffslizenz
-/-
-/-
DC.rights
-/-
NUMPAGES
Anzahl der Seiten
-/-
-/-
-/-
SP
NUMVOLUMES
Anzahl der Bände in einem Anchor
-/-
-/-
-/-
NV
PI_TOPSTRUCT
Identifier des Hauptwerkes
-/-
-/-
-/-
CN
COinS werden auf Werksseiten und Suchtrefferseiten ausgegeben. HighWire Press und DublinCore Metatags werden auf Werksseiten ausgegeben.
Last updated