2.11 Solr Schema
Allgemein
Das vom Goobi viewer Indexer und Goobi viewer Core verwendete Solr Schema befindet sich im Git Repository des Goobi viewer Indexers:
Feldtypen
Im Schema selbst gibt es verschiedene Arten von Feldern. Diese sind im folgenden erklärt
Feldtyp | Beispiel | Verwendung und Konfiguration |
statisch (fix) | DOCSTRCT, NUMPAGES | Diese Felder können nicht konfiguriert werden. Sie werden vom Goobi viewer Indexer automatisch geschrieben. |
statisch (konfigurierbar) | PI, CURRENTNO | Diese Felder haben einen statischen Namen. Der Inhalt kann allerdings via XPATH über die Konfigurationsdatei des Goobi viewer Indexers konfiguriert werden. |
MD_ | MD_TITLE | Alle Felder, die mit MD_ beginnen, können in der Goobi viewer Indexer Konfigurationsdatei frei konfiguriert werden. Es können alle Arten von Werten gespeichert werden. Je nach Feldkonfiguratioon werden auch Sortierfelder, Felder für die Facettierung, Untokenized Felder etc. geschrieben. |
MD2_ | MD2_DESCRIPTION | Funktioniert genauso wie MD_. Der Zweck dieses alternativen Musters ist, bestimmte Felder auf Wunsch von eine pauschalen Auslieferung auszuschließen (etwa wenn alle MD_* Felder über eine Schnittstelle ausgeliefert werden). |
MDNUM_ | MDNUM_PUBLICRELEASEYEAR | Funktioniert wie MD_, allerdings ist der Datentyp kein String, sondern ein Long, um etwa numerische Sortierung zu gewährleisten. |
BOOL_ | BOOL_DIRECTION_RTL | Alle Felder die mit BOOL_ beginnen, können in der Goobi viewer Indexer Konfigurationsdatei frei konfiguriert werden. Es können nur Booleans (true|false) gespeichert werden. Diese können, wenn sie in dem Quelldokument stehen direkt übernommen werden. Alternativ kann im XPATH-Ausdruck über boolean(string(...)) ein Boolean sichergestellt werden. |
SORT_ | SORT_TITLE | Felder mit SORT_ können direkt in der Konfigurationsdatei konfiguriert werden. Das ist zum Beispiel sinnvoll, wenn der Sortiertitel bereits explizit in den Metadaten ausgewiesen wird. Ansonsten kann der Schalter addSortField gesetzt werden, damit für ein Metadatum ein Sortierfeld geschrieben wird. Sortierfelder dürfen nur einen Wert enthalten. Die Felder stehen dann zum Beispiel für die Sortierung von Suchtreffern zur Verfügung. |
FACET_ | FACET_PLACEPUBLISH | Sonderform von Metadatenfelder, die zur effizienteren Facettierung herangezogen wird. Felder CENTURY, YEAR, DC, DOCSTRUCT, DOCSTRUCT_*, MD_* und MD_* werden automatisch als eine FACET_* Kopie angelegt. Konfiguriert wird für die Facettierung der ursprüngliche Feldname, und die FACET_* Variante wird automatisch verwendet. |
_UNTOKENIZED | MD_TITLE_UNTOKENIZED | Felder mit dem Suffix _UNTOKENIZED dürfen in der Konfigurationsdatei nicht direkt konfiguriert werden. Die Felder werden zum Beispiel in der Stöbern-Funktion benötigt. Ob ein _UNTOKENIZED Feld geschrieben wird, wird über den Schalter addUntokenizedVersion gesteuert. |
_LANG_XX | MD_TITLE_LANG_DE | Felder mit LANG_XX können als Suffix zu MD_ Feldern frei definiert werden. Dabei muss XX gegen ein valides Sprachkürzel ausgetauscht werden, zum Beispiel DE, EN, FR oder ES. Wenn im Solr Index Werte in Feldern mit _LANG_XX Suffix stehen, wertet der Goobi viewer Core diese aus und unterstützt dann nicht nur die Mehrsprachigkeit in der Oberfläche, sondern auch für die Metadatenwerte. |
NORM_ | NORM_ALTNAME | Suchbare Medatenfelder, die aus Normdatensätzen importiert wurden. |
GROUPID_ / GROUPORDER_ | GROUPID_SERIES, GROUPORDER_SERIES | Felder, die Gruppenzugehörigkeit (etwa zu einer Bandserie) beschreiben. GROUPID_ enthält dabei den Identifier des Gruppe, GROUPORDER_ die Sortierreihenfolge des betreffenden Werks in dieser Gruppe. Der Wert hinter dem Unterstrich muss |
DATE_ | DATE_PUBLICRELEASE | Felder mit dem Solr-Datentype TrieDateField speichern Zeitstempel (YYYY-MM-DDThh:mm:ssZ). Für künftige Anwendungsszenarien. |
spezielle Felder
Einige Felder im Suchindex werden im Goobi viewer Core statisch referenziert um bestimmte Funktionen zur Verfügung zu stellen. Diese sind in der folgenden Matrix aufgeführt:
Solr-Feldname | gespeicherte Information | COinS | HighWire Press | DublinCore | RIS |
| Titel des Werkes | rft.title | citation_title | DC.title | TI |
| Alternativtitel | -/- | -/- | -/- | J2 |
| Name des Autors | rft.au | citation_author | DC.creator | AU |
| Name des Editors | -/- | -/- | -/- | ED |
| Körperschaft | rft.aucorp | -/- | -/- | -/- |
| ISBN-Nummer | rft.isbn | citation_isbn | -/- | SN |
| ISSN-Nummer | rft.issn | citation_issn | -/- | SN |
| Erscheinungs-jahr | rft.date | citation_publication _date | DC.date | PY |
| Verlag | rft.pub | -/- | DC.publisher | PB |
| Erscheinungsort | rft.place | -/- | -/- | PP |
| Edition | rtf.edition | -/- | -/- | ET |
| Serie | rft.series | -/- | -/- | -/- |
| Schlagwort | rft.subject | -/- | -/- | -/- |
| Sprache | rft.language | citation_language | DC.language | LA |
| Bandnummer | -/- | citation_volume | -/- | VL |
| Abstract zum Werk | -/- | description | DCTERMS.abstract | AB |
| Generische Notiz | -/- | -/- | -/- | N1 |
| Geographisches Schlagwort | -/- | -/- | -/- | KW |
| Personen-schlagwort | -/- | -/- | -/- | KW |
| Werkschlagwort | -/- | -/- | -/- | KW |
| URN des Werkes | -/- | -/- | DC.identifier | -/- |
| Zugriffslizenz | -/- | -/- | DC.rights | -/- |
| Anzahl der Seiten | -/- | -/- | -/- | SP |
| Anzahl der Bände in einem Anchor | -/- | -/- | -/- | NV |
| Identifier des Hauptwerkes | -/- | -/- | -/- | CN |
COinS werden auf Werksseiten und Suchtrefferseiten ausgegeben. HighWire Press und DublinCore Metatags werden auf Werksseiten ausgegeben.
Last updated