2.11 Solr Schema

Allgemein

Das vom Goobi viewer Indexer und Goobi viewer Core verwendete Solr Schema befindet sich im Git Repository des Goobi viewer Indexers:

Feldtypen

Im Schema selbst gibt es verschiedene Arten von Feldern. Diese sind im folgenden erklärt

Feldtyp

Beispiel

Verwendung und Konfiguration

statisch (fix)

DOCSTRCT, NUMPAGES

Diese Felder können nicht konfiguriert werden. Sie werden vom Goobi viewer Indexer automatisch geschrieben.

statisch (konfigurierbar)

PI, CURRENTNO

Diese Felder haben einen statischen Namen. Der Inhalt kann allerdings via XPATH über die Konfigurationsdatei des Goobi viewer Indexers konfiguriert werden.

MD_

MD_TITLE

Alle Felder, die mit MD_ beginnen, können in der Goobi viewer Indexer Konfigurationsdatei frei konfiguriert werden. Es können alle Arten von Werten gespeichert werden. Je nach Feldkonfiguratioon werden auch Sortierfelder, Felder für die Facettierung, Untokenized Felder etc. geschrieben.

MD2_

MD2_DESCRIPTION

Funktioniert genauso wie MD_. Der Zweck dieses alternativen Musters ist, bestimmte Felder auf Wunsch von eine pauschalen Auslieferung auszuschließen (etwa wenn alle MD_* Felder über eine Schnittstelle ausgeliefert werden).

MDNUM_

MDNUM_PUBLICRELEASEYEAR

Funktioniert wie MD_, allerdings ist der Datentyp kein String, sondern ein Long, um etwa numerische Sortierung zu gewährleisten.

BOOL_

BOOL_DIRECTION_RTL

Alle Felder die mit BOOL_ beginnen, können in der Goobi viewer Indexer Konfigurationsdatei frei konfiguriert werden. Es können nur Booleans (true|false) gespeichert werden. Diese können, wenn sie in dem Quelldokument stehen direkt übernommen werden. Alternativ kann im XPATH-Ausdruck über boolean(string(...)) ein Boolean sichergestellt werden.

SORT_

SORT_TITLE

Felder mit SORT_ können direkt in der Konfigurationsdatei konfiguriert werden. Das ist zum Beispiel sinnvoll, wenn der Sortiertitel bereits explizit in den Metadaten ausgewiesen wird. Ansonsten kann der Schalter addSortField gesetzt werden, damit für ein Metadatum ein Sortierfeld geschrieben wird. Sortierfelder dürfen nur einen Wert enthalten. Die Felder stehen dann zum Beispiel für die Sortierung von Suchtreffern zur Verfügung.

FACET_

FACET_PLACEPUBLISH

Sonderform von Metadatenfelder, die zur effizienteren Facettierung herangezogen wird. Felder CENTURY, YEAR, DC, DOCSTRUCT, DOCSTRUCT_*, MD_* und MD_* werden automatisch als eine FACET_* Kopie angelegt. Konfiguriert wird für die Facettierung der ursprüngliche Feldname, und die FACET_* Variante wird automatisch verwendet.

_UNTOKENIZED

MD_TITLE_UNTOKENIZED

Felder mit dem Suffix _UNTOKENIZED dürfen in der Konfigurationsdatei nicht direkt konfiguriert werden. Die Felder werden zum Beispiel in der Stöbern-Funktion benötigt. Ob ein _UNTOKENIZED Feld geschrieben wird, wird über den Schalter addUntokenizedVersion gesteuert.

_LANG_XX

MD_TITLE_LANG_DE

Felder mit LANG_XX können als Suffix zu MD_ Feldern frei definiert werden. Dabei muss XX gegen ein valides Sprachkürzel ausgetauscht werden, zum Beispiel DE, EN, FR oder ES. Wenn im Solr Index Werte in Feldern mit _LANG_XX Suffix stehen, wertet der Goobi viewer Core diese aus und unterstützt dann nicht nur die Mehrsprachigkeit in der Oberfläche, sondern auch für die Metadatenwerte.

NORM_

NORM_ALTNAME

Suchbare Medatenfelder, die aus Normdatensätzen importiert wurden.

GROUPID_ / GROUPORDER_

GROUPID_SERIES, GROUPORDER_SERIES

Felder, die Gruppenzugehörigkeit (etwa zu einer Bandserie) beschreiben. GROUPID_ enthält dabei den Identifier des Gruppe, GROUPORDER_ die Sortierreihenfolge des betreffenden Werks in dieser Gruppe. Der Wert hinter dem Unterstrich muss

DATE_

DATE_PUBLICRELEASE

Felder mit dem Solr-Datentype TrieDateField speichern Zeitstempel (YYYY-MM-DDThh:mm:ssZ). Für künftige Anwendungsszenarien.

spezielle Felder

Einige Felder im Suchindex werden im Goobi viewer Core statisch referenziert um bestimmte Funktionen zur Verfügung zu stellen. Diese sind in der folgenden Matrix aufgeführt:

Solr-Feldname

gespeicherte Information

COinS

HighWire Press

DublinCore

RIS

MD_TITLE

Titel des Werkes

rft.title

citation_title

DC.title

TI

MD_ALTERNATETITLE

Alternativtitel

-/-

-/-

-/-

J2

MD_CREATOR

Name des Autors

rft.au

citation_author

DC.creator

AU

MD_EDITOR

Name des Editors

-/-

-/-

-/-

ED

MD_CORPORATION

Körperschaft

rft.aucorp

-/-

-/-

-/-

MD_ISBN

ISBN-Nummer

rft.isbn

citation_isbn

-/-

SN

MD_ISSN

ISSN-Nummer

rft.issn

citation_issn

-/-

SN

MD_YEARPUBLISH

Erscheinungs-jahr

rft.date

citation_publication _date

DC.date

PY

MD_PUBLISHER

Verlag

rft.pub

-/-

DC.publisher

PB

MD_PLACEPUBLISH

Erscheinungsort

rft.place

-/-

-/-

PP

MD_EDITION

Edition

rtf.edition

-/-

-/-

ET

MD_SERIES

Serie

rft.series

-/-

-/-

-/-

MD_SUBJECT

Schlagwort

rft.subject

-/-

-/-

-/-

MD_LANGUAGE

Sprache

rft.language

citation_language

DC.language

LA

CURRENTNO

Bandnummer

-/-

citation_volume

-/-

VL

MD_INFORMATION

Abstract zum Werk

-/-

description

DCTERMS.abstract

AB

MD_NOTE

Generische Notiz

-/-

-/-

-/-

N1

MD_GEOKEYWORD

Geographisches Schlagwort

-/-

-/-

-/-

KW

MD_PERSONKEYWORD

Personen-schlagwort

-/-

-/-

-/-

KW

MD_WORKKEYWORD

Werkschlagwort

-/-

-/-

-/-

KW

URN

URN des Werkes

-/-

-/-

DC.identifier

-/-

ACCESSCONDITION

Zugriffslizenz

-/-

-/-

DC.rights

-/-

NUMPAGES

Anzahl der Seiten

-/-

-/-

-/-

SP

NUMVOLUMES

Anzahl der Bände in einem Anchor

-/-

-/-

-/-

NV

PI_TOPSTRUCT

Identifier des Hauptwerkes

-/-

-/-

-/-

CN

COinS werden auf Werksseiten und Suchtrefferseiten ausgegeben. HighWire Press und DublinCore Metatags werden auf Werksseiten ausgegeben.

Last updated