Sudan Memory Übersetzungen
Dieses Statistik-Plugin ermittelt die Aktivität der Bearbeitungen von Übersetzungen innerhalb spezifischer Metadatenfelder.

Einführung

Dieses Statistik-Plugin ermöglicht eine statistische Erfassung der Aktivität von Übersetzern und Bearbeitern, die innerhalb des METS-Dateien spezifische Metadatenfelder bearbeiten. Hierbei werden insbesondere die Übersetzungsarbeiten in den Metadatenfeldern Title (Arabic), Title (English), Description (English) und Description (Arabic) berücksichtigt.

Übersicht

Details
Identifier
intranda_statistics_sudan_memory_activity_by_user
Lizenz
GPL 2.0 oder neuer
Kompatibilität
Goobi workflow 20.10
Dokumentationsdatum
03.01.2021

Installation

Zur Installation des Plugins müssen folgende beiden Dateien installiert werden:
1
/opt/digiverso/goobi/plugins/statistics/plugin_intranda_statistics_sudan.jar
2
/opt/digiverso/goobi/plugins/GUI/plugin_intranda_statistics_sudan-GUI.jar
Copied!
Zusätzlich muss innerhalb der Datenbank die folgende Funktion erstellt werden:
1
DROP FUNCTION IF EXISTS wordcount;
2
3
DELIMITER $
4
CREATE FUNCTION wordcount(str TEXT CHARSET utf8mb4)
5
RETURNS INT
6
DETERMINISTIC
7
SQL SECURITY INVOKER
8
NO SQL
9
BEGIN
10
DECLARE wordCnt, idx, maxIdx INT DEFAULT 0;
11
DECLARE currChar, prevChar BOOL DEFAULT 0;
12
SET maxIdx=char_length(str);
13
WHILE idx < maxIdx DO
14
SET currChar=SUBSTRING(str, idx, 1) RLIKE '[[:alnum:]]';
15
IF NOT prevChar AND currChar THEN
16
SET wordCnt=wordCnt+1;
17
END IF;
18
SET prevChar=currChar;
19
SET idx=idx+1;
20
END WHILE;
21
RETURN wordCnt;
22
END
23
$
24
DELIMITER ;
Copied!
Dieser Funktion kann ein UTF8-codierter Text übergeben werden. Der Text wird Zeichen für Zeichen überprüft. Wenn das aktuelle Zeichen ein alnumerisches Zeichen ist (Buchstaben, Zahlen, Punkt, Komma, Buchstaben mit Diakritika, Klammern), das vorherige Zeichen jedoch nicht (Nichts, Leerzeichen, Zeilenumbruch, Tabulator), beginnt an dieser Stelle ein neues Wort und der Wortzähler wird erhöht. Am Ende wird der Wortzähler zurückgegeben.

Konfiguration des Plugins

Für eine Nutzung dieses Plugins muss der Nutzer über die korrekte Rollenberechtigung verfügen.
Ohne korrekte Berechtigung ist das Plugin nicht nutzbar
Bitte weisen Sie daher der Gruppe die Rolle view_translation_activity zu.
Korrekt zugewiesene Rolle für die Nutzer
Anschließend kann der Menüpunkt Aktivität Übersetzung und Bearbeitung im Bereich Controlling ausgewählt werden.
Aufrufen des Plugins im Menü

Bedienung des Plugins

Um den Zeitraum der Auswertung zu begrenzen, können die beiden Felder Zeitraum von und Zeitraum bis für das Startdatum und Enddatum genutzt werden. Hier kann ein Datum in der Form YYYY-MM-DD angegeben werden. Beide Angaben sind optional. Wenn das Startdatum nicht ausgefüllt wurde, gilt das Datum, an dem der erste Schritt abgeschlossen wurde. Fehlt das Enddatum, dann wird der aktuelle Zeitpunkt genutzt.
Auswahl des Zeitraums
Im Feld Einheit wird festgelegt, in welchen Zeiträumen die Auswertung zusammengefasst werden soll. Hier kann aus den Werten Tage, Monate, Quartale oder Jahre gewählt werden.
Nach Angabe der benötigten Informationen können von diesem Plugin zwei verschiedene Auswertungen generiert werden:

Auswertung: Überblick

Die Auswertung Überblick listet für jeden Zeitraum innerhalb des Start- und Enddatums auf, welcher Nutzer wie viele Arbeitsschritte Translation of Arabic content to English oder Translation of English content to Arabic bearbeitet hat. Dabei wird ebenfalls angegeben, wie viele Worte in den Feldern Title (Arabic), Title (English), Description (English) und Description (Arabic) in diesen Schritten insgesamt erfasst wurden.

Auswertung: Detaillierte Anzeige

Die Detaillierte Anzeige listet jeden Arbeitsschritt Translation of Arabic content to English oder Translation of English content to Arabic auf, der innerhalb des angegebenen Start- und Enddatums abgeschlossen wurde. Zu jedem Arbeitsschritt wird außerdem der Nutzer, der zugehörige Vorgang, sowie der Inhalt und die Anzahl der Wörter aus den vier Feldern Title (Arabic), Title (English), Description (English) und Description (Arabic) angezeigt.
Anzeige der Ergebnisse mit Möglichkeit für den Download
Die beiden Auswertungen lassen sich auch jeweils als Excel-Datei herunterladen.

Weitere technische Informationen

Im folgenden werden einige SQL-Statements aufgeführt, die für die Arbeit mit den Daten im Rahmen dieses Plugins nützlich sein können.
SQL query über eine Gesamtübersicht:
1
SELECT
2
DATE_FORMAT(s.BearbeitungsEnde, '%Y-%m') AS plugin_statistics_sudan_timeRange,
3
WORDCOUNT(GROUP_CONCAT(m1.value SEPARATOR ' ')) AS plugin_statistics_sudan_titleCount,
4
WORDCOUNT(GROUP_CONCAT(m2.value SEPARATOR ' ')) AS plugin_statistics_sudan_titlearabicCount,
5
WORDCOUNT(GROUP_CONCAT(m3.value SEPARATOR ' ')) AS plugin_statistics_sudan_descriptionCount,
6
WORDCOUNT(GROUP_CONCAT(m4.value SEPARATOR ' ')) AS plugin_statistics_sudan_descriptionarabicCount,
7
COUNT(s.Titel) AS plugin_statistics_sudan_workflowTitleCount,
8
CONCAT(u.Nachname, ', ', u.Vorname) AS plugin_statistics_sudan_userName
9
FROM
10
metadata m1
11
JOIN
12
metadata m2 ON m1.processid = m2.processid
13
JOIN
14
metadata m3 ON m1.processid = m3.processid
15
JOIN
16
metadata m4 ON m1.processid = m4.processid
17
JOIN
18
schritte s ON m1.processid = s.ProzesseID
19
LEFT JOIN
20
benutzer u ON s.BearbeitungsBenutzerID = u.BenutzerID
21
WHERE
22
m1.name = 'TitleDocMain'
23
AND m2.name = 'TitleDocMainArabic'
24
AND m3.name = 'ContentDescription'
25
AND m4.name = 'ContentDescriptionArabic'
26
AND s.typMetadaten = TRUE
27
AND s.Bearbeitungsstatus = 3
28
AND s.titel like '%ranslat%'
29
AND s.BearbeitungsEnde BETWEEN '2019-01-01' AND '2020-12-31'
30
GROUP BY plugin_statistics_sudan_timeRange, plugin_statistics_sudan_userName;
Copied!
SQL query für einen detaillierten Bericht:
1
SELECT
2
m1.processid,
3
m1.value AS plugin_statistics_sudan_title,
4
WORDCOUNT(m1.value) AS plugin_statistics_sudan_titleCount,
5
m2.value AS plugin_statistics_sudan_titlearabic,
6
WORDCOUNT(m2.value) AS plugin_statistics_sudan_titlearabicCount,
7
m3.value AS plugin_statistics_sudan_description,
8
WORDCOUNT(m3.value) AS plugin_statistics_sudan_descriptionCount,
9
m4.value AS plugin_statistics_sudan_descriptionarabic,
10
WORDCOUNT(m4.value) AS plugin_statistics_sudan_descriptionarabicCount,
11
s.Titel AS plugin_statistics_sudan_workflowTitle,
12
p.Titel AS plugin_statistics_sudan_processTitle,
13
CONCAT(u.Nachname, ', ', u.Vorname) AS plugin_statistics_sudan_userName
14
FROM
15
metadata m1
16
JOIN
17
metadata m2 ON m1.processid = m2.processid
18
JOIN
19
metadata m3 ON m1.processid = m3.processid
20
JOIN
21
metadata m4 ON m1.processid = m4.processid
22
JOIN
23
schritte s ON m1.processid = s.ProzesseID
24
LEFT JOIN
25
prozesse p ON s.ProzesseID = p.ProzesseID
26
LEFT JOIN
27
benutzer u ON s.BearbeitungsBenutzerID = u.BenutzerID
28
WHERE
29
m1.name = 'TitleDocMain'
30
AND m2.name = 'TitleDocMainArabic'
31
AND m3.name = 'ContentDescription'
32
AND m4.name = 'ContentDescriptionArabic'
33
AND s.typMetadaten = TRUE
34
AND s.titel like '%ranslat%'
35
AND s.Bearbeitungsstatus = 3
36
AND s.BearbeitungsEnde BETWEEN '2019-01-01' AND '2020-12-31';
Copied!