Direkt zum Inhalt

Linked Open Data für die Weimarer Republik - Der Weimar-Wissensgraph

Von Archivportal-D

Im Rahmen des DFG-Projektes „Sachthematische Zugänge im Archivportal-D am Beispiel Weimarer Republik“ entwickelte das Team Information Service Engineering des FIZ Karlsruhe den Weimar Wissensgraph. Dieser basiert auf 21.043 historischen Dokumenten der Weimarer Republik aus den Beständen des Bundesarchivs und des Landesarchivs Baden-Württemberg.

Der Weimar Wissensgraph verknüpft hierbei allgemeine Metadaten (Erschließungsinformationen), wie Struktur, Provenienz und Signatur der Akten, sowie semantische Metadaten wie Schlagwörter, Kategorien und Laufzeit der Objekte in einer maschinenverstehbaren Form. Solch eine strukturierte Darstellung der Konzepte ermöglicht auch Maschinen, die Informationen zu verstehen und Menschen bei der Exploration und der Informationssuche zu unterstützen.

Schaubild Knowledge Graph Weimar

Schaubild zum Knowledge Graph "Weimarer Republik"

Nach den Linked-Open-Data-Prinzipien sind die Fakten durch semantische Tripel in der Form von Subjekt-Prädikat-Objekt ausgedrückt. Das Subjekt und das Prädikat sind immer URIs (Ressourcen) und  das Objekt kann eine URI oder ein Literal sein.

 

Beispiel:

Der Akte  mit dem Titel “Kahr-Putsch in München" (DE-1958_faf4901b-4b3c-4fc3-85f6-d62ad0efc9ef) wurde das Schlagwort“Hitler-Ludendorff-Putsch” zugeordnet.

Archivale Kahr-Putsch-München
Auszug aus der Akte "Kahr-Putsch in München", BArch R 8048/665 | Aktenzeichen: 42b-12-1.

Im Wissensgraph wird das durch diese drei Tripel ausgedrückt:

@prefix ardo: <http://vocab.archivportal-d.de/00002#> .
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix rdfs: <https://www.w3.org/2000/01/rdf-schema#> .

ardo:DE-1958_faf4901b-4b3c-4fc3-85f6-d62ad0efc9ef dc:title “Kahr-Putsch im München” .
ardo:DE-1958_faf4901b-4b3c-4fc3-85f6-d62ad0efc9ef ardo:tagged_with ardo:Key837  .
ardo:Key837 rdfs:label “Hitler-Ludendorff-Putsch”@de  .

 

Durch die einfache Verlinkung der Daten erreicht das Modell somit eine sehr hohe Flexibilität, erhöhte Auffindbarkeit der Daten bei der Internetsuche, Interoperabilität und Nachnutzbarkeit. Mithilfe der Abfragesprache SPARQL können die Tripel auch unkompliziert abgefragt und exploriert werden. Auf den Weimar Wissensgraph kann von einem maschinenlesbaren SPARQL-Endpunkt zugegriffen werden. Damit können Benutzer*innen eine Wissensdatenbank über die SPARQL-Sprache abfragen.

 

Beispiel:

Eine SPARQL-Abfrage, die das Label des Schlagwortes “Hitler-Ludendorff-Putsch” (http://vocab.archivportal-d.de/00002#Key837) und dessen Normdateninfomationen, also die englische Definition und das Foto aus Wikidata zeigt, kann wie folgt aussehen:

PREFIX ardo: <http://vocab.archivportal-d.de/00002#>
PREFIX schema: <http://schema.org/>

PREFIX wdt: <http://www.wikidata.org/prop/direct/>
SELECT ?keyword ?description ?image

 

WHERE {ardo:Key837 owl:sameAs ?wd_keyword    ;
      rdfs:label ?keyword    .
      SERVICE <https://query.wikidata.org/sparql> {
        ?wd_keyword wdt:P18 ?image ;
                                  schema:description ?description 
                                       FILTER (LANG(?description) ="en")    .
                }
      }

 

Antwort der SPARQL-Abfrage aus Wikidata:

SPARQL Abfrage Wikidata

 

Zum Weiterlesen:

Hoppe, F., Tietz, T., Dessı, D., Meyer, N., Sprau, M., Alam, M., & Sack, H. (2020). The Challenges of German Archival Document Categorization on Insufficient Labeled Data. In WHiSe 2020: Workshop on Humanities in the Semantic Web 2020-Proceedings of the Third Workshop on Humanities in the Semantic Web (WHiSe 2020), co-located with 15th Extended Semantic Web Conference (ESWC 2020), Heraklion, Greece, June 2, 2020 (online). Ed.: A. Adamou (p. 15). PDF

Vsesviatska, O., Tietz, T., Hoppe, F., Sprau, M., Meyer, N., Dessì, D., & Sack, H. (2021). ArDO: An Ontology to Describe the Dynamics of Multimedia Archival Records. In Proceedings of the 2021 ACM Symposium on Applied Computing (pp. 1855-1864). PDF

OpenHPI MOOC-Kurs zum Thema Wissensgraphen  https://open.hpi.de/courses/knowledgegraphs2020