Grundlagen der Schlussfolgerungen in SHACL
Foundations of Reasoning in the Shape Constraint Language
Wissenschaftsdisziplinen
Informatik (90%); Mathematik (10%)
Keywords
- Constraint Language,
- Description Logics,
- Inconsistency Handling,
- Computational Complexity,
- Logic and Databases,
- Answer Set Programming
The Semantic Web is an initiative of the World Wide Web Consortium (W3C) that extends the World Wide Web by setting standards to organize Web data so that it can be processed by machines. As a first step towards this aim, W3C standardized in 2004 the Resource Description Framework (RDF) as the data model of the Web. RDF offers a flexible semi-structured format, by storing data as triples, easily representable as a graph, which makes it suitable for modeling information from Web resources. This has favored its wide adoption and large and growing RDF graphs are continuously being published on the Web. However, one often encounters RDF data that is incorrect. As ensuring data quality became increasingly important in RDF-based applications, the presence of faulty facts in RDF graphs has been widely acknowledged as a serious issue. To address this, W3C recommended in 2017 the Shapes Constraint Language (or SHACL), a machine-readable constraint language for describing and validating RDF graphs. Intuitively, it allows us to specify a set of conditions to be checked against an RDF graph, which can be exploited by applications to improve the quality of the graph. SHACL has already been adopted by existing tools and software packages and has been the focus of research works. However, being only a recent W3C standard, SHACL is not yet well-understood, and its theoretical foundations are not yet well-established. This project will develop solid theoretical foundations for SHACL, paving the way for powerful techniques for intelligent Web data management and reasoning about data quality, and significantly advancing the current state-of-the-art. We will investigate fundamental static analysis tasks aimed at supporting the design of SHACL constraints as well as the yet unexplored but crucial task of how to handle violations of SHACL constraints by RDF graphs. More precisely, the first major goal of the project is to investigate the satisfiability and containment of SHACL constraints, the most primitive static analysis problems that lie at the core of constraint design and optimization techniques. These tasks are crucial for building meaningful sets of SHACL constraints without inconsistencies, but also for optimization purposes. The second major goal is to formalize the notions of explanations and repairs for SHACL and study their properties. Roughly, this allows us to explain why some RDF graph violates the SHACL constraints and to provide ways to fix the graph so that it conforms with the constraints. This is a key point mentioned in the SHACL specification, under so-called validation reports. This study will also clarify the relationship between the emerging and the classic approaches to managing data inconsistency and explanations, e.g., it will allow us to transfer existing results from the setting of the closely related language OWL and that of databases to the setting of SHACL.
Daten spielen in unserer digitalen Welt eine immer wichtigere Rolle. Damit sie für Menschen und Anwendungen nützlich sind, müssen sie korrekt und vertrauenswürdig sein. Die heute verfügbare Vielfalt und Menge an Daten führt jedoch häufig zu Fehlern, fehlenden Informationen und falschen Fakten. Dies gilt besonders, wenn große Datenmengen aus verschiedenen Quellen zusammengeführt werden oder wenn Daten im Web gespeichert sind, wo sie oft unvollständig oder fehlerhaft sind und zu falschen Schlussfolgerungen führen können. Die Sicherung von Datenqualität ist daher eine zentrale Herausforderung, insbesondere in Bereichen wie Gesundheitswesen, Bankwesen, Wirtschaft, Wissenschaft und öffentlicher Verwaltung, wo Entscheidungen auf der Grundlage korrekter Daten entscheidend sind. Dieses Projekt widmete sich solchen Herausforderungen, indem es theoretische Grundlagen für die automatische Feststellung und Verbesserung der Qualität von Web-ähnlichen Daten entwickelte, die als Wissensgraphen dargestellt werden. Wissensgraphen stellen Informationen als Objekte und Beziehungen zwischen ihnen dar, zum Beispiel Personen, Organisationen oder Produkte und deren Verbindungen. Das Projekt konzentrierte sich auf SHACL, eine standardisierte Sprache zur Beschreibung und Validierung von Constraints für Wissensgraphen. Solche Constraints können zum Beispiel ausdrücken, dass jede Person genau ein Geburtsdatum haben soll oder dass jede Publikation mindestens eine Autorin oder einen Autor haben muss. SHACL wird bereits von vielen Werkzeugen und Softwaresystemen verwendet, doch zu Beginn des Projekts waren seine theoretischen Grundlagen noch nicht ausreichend verstanden. Dieses Projekt trug dazu bei, diese Grundlagen weiterzuentwickeln. Ein zentraler Beitrag war die Untersuchung von Erklärungen und Reparaturen für Verletzungen von SHACL-Constraints. Statt nur festzustellen, dass Daten ungültig sind, helfen die entwickelten Methoden dabei, die problematischen Teile der Daten zu identifizieren und zu analysieren, welche Änderungen die Daten wieder gültig machen könnten. Dies unterstützt transparenteres Datenqualitätsmanagement und hilft Nutzerinnen und Nutzern, komplexe Datensammlungen zu verstehen, Validierungsergebnisse zu erklären und Daten zu verbessern. In vielen Anwendungen verändern sich Wissensgraphen im Laufe der Zeit, oft wiederholt und automatisch. Das Projekt untersuchte daher auch, ob eine gegebene Änderungsoperation die Constraints garantiert erhält, und zwar für alle möglichen Eingabedaten, die diese Constraints bereits erfüllen. Dies ist nützlich, weil dasselbe Änderungsmuster häufig auf sehr große Datenbestände angewendet werden kann; wenn seine Sicherheit einmal nachgewiesen wurde, kann dies aufwendige wiederholte Validierung reduzieren und Fehler verhindern, bevor sie in die Daten gelangen. Das Projekt untersuchte außerdem, wie man auch bei fehlerhaften oder unvollständigen Daten sinnvolle Antworten erhalten kann, indem mögliche Reparaturen berücksichtigt und weiterhin verlässliche Informationen genutzt werden. Zudem wurden effiziente Validierungsmethoden für komplexe SHACL-Constraints untersucht, um unnötige Berechnungen in großen Wissensgraphen zu vermeiden. Schließlich klärte das Projekt, wie SHACL mit Wikidata-Constraints, Ontologien, Beschreibungslogiken und verwandten Graph-Schema-Sprachen wie ShEx und PG Schema zusammenhängt, und verband damit verschiedene Fachgemeinschaften und Technologien für strukturierte Daten. Insgesamt trägt das Projekt zu vertrauenswürdigeren digitalen Daten bei und unterstützt zukünftige Werkzeuge zur automatischen Überprüfung, Erklärung und Verbesserung von Datenqualität.
- Technische Universität Wien - 100%
- Meghyn Bienvenu, Université Montpellier - Frankreich
- Diego Calvanese, Libera Università di Bolzano - Italien
Research Output
- 19 Zitationen
- 11 Publikationen
- 1 Software
- 14 Wissenschaftliche Auszeichnungen
-
2023
Titel Reconciling SHACL and Ontologies: Semantics and Validation via Rewriting DOI 10.3233/faia230250 Typ Book Chapter Autor Ahmetaj S Verlag IOS Press Link Publikation -
2024
Titel Formalizing and validating Wikidata's property constraints using SHACL and SPARQL DOI 10.3233/sw-243611 Typ Journal Article Autor De Souza J Journal Semantic Web -
2024
Titel Consistent Query Answering over SHACL Constraints DOI 10.24963/kr.2024/1 Typ Conference Proceeding Abstract Autor Ahmetaj S Seiten 2-13 -
2026
Titel Modeling State Causality in Energy Centred Cyber-Physical-Human Systems With OntoUML DOI 10.1109/access.2026.3683445 Typ Journal Article Autor Bilal M Journal IEEE Access -
2026
Titel Common Foundations for Recursive Shape Languages Typ Conference Proceeding Abstract Autor Ahmetaj Shqiponja Konferenz 23rd International Conference on Principles of Knowledge Representation and Reasoning -
2026
Titel GEV: Statically Correct and Programmable Knowledge Graph Updates Typ Conference Proceeding Abstract Autor Eduard Kamburjan Konferenz IJCAI-ECAI 2026 -
2025
Titel A Logic Programming Approach to Repairing SHACL Constraint Violations DOI 10.4230/tgdk.3.3.1 Typ Journal Article Autor Ahmetaj S Journal Transactions on Graph Data and Knowledge (TGDK) Seiten 1:1 - 1:36 Link Publikation -
2025
Titel Common Foundations for SHACL, ShEx, and PG-Schema DOI 10.1145/3696410.3714694 Typ Conference Proceeding Abstract Autor Ahmetaj S Seiten 8-21 Link Publikation -
2022
Titel Magic shapes for SHACL validation DOI 10.14778/3547305.3547329 Typ Journal Article Autor Ahmetaj S Journal Proceedings of the VLDB Endowment Seiten 2284-2296 Link Publikation -
2025
Titel SHACL Validation Under Graph Updates DOI 10.1007/978-3-032-09527-5_8 Typ Book Chapter Autor Ahmetaj S Verlag Springer Nature Seiten 140-157 -
2025
Titel OWLstrict: A Constrained OWL Fragment to Avoid Ambiguities for Knowledge Graph Practitioners DOI 10.1007/978-3-031-94578-6_3 Typ Book Chapter Autor David R Verlag Springer Nature Seiten 47-64
-
2026
Titel Dagstuhl Seminar 26282, KR Meets XAI, 2026 Typ Prestigious/honorary/advisory position to an external body Bekanntheitsgrad Continental/International -
2025
Titel KR 2025 Doctoral Consortium Chair Typ Prestigious/honorary/advisory position to an external body Bekanntheitsgrad Continental/International -
2025
Titel RULEML+RR 2025 Doctoral Consortium Chair Typ Awarded honorary membership, or a fellowship, of a learned society Bekanntheitsgrad Continental/International -
2025
Titel Jury Member, Hedy Lamarr Award, City of Vienna Typ Prestigious/honorary/advisory position to an external body Bekanntheitsgrad National (any country) -
2024
Titel Jury Member of PhD Thesis Defense Typ Prestigious/honorary/advisory position to an external body Bekanntheitsgrad Continental/International -
2024
Titel VCLA Awards 2024 Chair Typ Awarded honorary membership, or a fellowship, of a learned society Bekanntheitsgrad Continental/International -
2024
Titel Dagstuhl Seminar Organizer 2024 Typ Prestigious/honorary/advisory position to an external body Bekanntheitsgrad Continental/International -
2024
Titel Hasselt University invited talk Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International -
2024
Titel KR 2024 Diversity and Inclusion Session Chair Typ Awarded honorary membership, or a fellowship, of a learned society Bekanntheitsgrad Continental/International -
2023
Titel Top 100 Women Innovators of the DACH Region, including Germany, Austria, and Switzerland, in the area of Telecommunication, Digitalization and IT, from SHE Wirtschaftsmedien-Beteiligungs GmbH Typ National honour e.g. Order of Chivalry, OBE Bekanntheitsgrad Continental/International -
2023
Titel Editorial Board Member of Transactions on Graph Data and Knowledge (TGDK) Journal Typ Appointed as the editor/advisor to a journal or book series Bekanntheitsgrad Continental/International -
2022
Titel Social Event Chair at IJCAI-ECAI Typ Prestigious/honorary/advisory position to an external body Bekanntheitsgrad Continental/International -
2022
Titel Hedy Lamarr Prize 2022 Typ National honour e.g. Order of Chivalry, OBE Bekanntheitsgrad National (any country) -
2021
Titel netidee SCIENCE funding Typ National honour e.g. Order of Chivalry, OBE Bekanntheitsgrad National (any country)