Mensch-zentrierte Evaluierung von Ontologien (HOnEst)
Human-centric Ontology Evaluation (HOnEst)
Wissenschaftsdisziplinen
Informatik (100%)
Keywords
-
Human Computatio,
Crowdsourcing,
Semantic Web,
Ontology,
Ontology Evaluation
In den letzten Jahren wurden im Bereich intelligenter Systeme bedeutende Fortschritte erzielt, beispielsweise kann IBMs Watson konkrete Fragestellungen beantworten oder Chatbots können Konversationen führen. Die Erwartungshaltung der Anwender an solche Systeme ist, dass diese wahrheitsgetreu und unverfälscht agieren, korrekte Aussagen treffen und unterschiedliche Sichtweisen berücksichtigen. Das Verhalten solcher Systeme ist allerdings stark abhängig von der Qualität der zugrundeliegenden Wissensbasis ab, die oft in Datenstrukturen, wie beispielsweise Ontologien, abgelegt wird. Derartige Ontologien werden oft automatisch aus großen Textsammlungen extrahiert und können entsprechend umfangreich und sehr komplex werden. Automatische Extraktionsmechanismen sind jedoch anfällig für die Erzeugung fehlerhafter oder verfälschter Ontologien. Die Erkennung derartiger Mängel ist derzeit oft nicht automatisierbar und muss typischerweise von Menschen durchgeführt werden. Ziel des Projekts HOnEst ist die Unterstützung der Verifikation von Ontologien und die Verbesserung von Ontologien durch skalierbare und Mensch-zentrierte Bewertungen, um anhand dieser Ontologien faktisch korrektes und unverfälschtes Systemverhalten zu ermöglichen. Der erste Schritt im Rahmen des Projekts HOnEst ist eine Literaturrecherche, um den aktuellen Stand der Technik von Ansätzen für nicht automatisch auffindbare Mängel in Ontologien zu identifizieren, die eine menschliche Bewertungen erfordern. Darauf aufbauend, werden Methoden aus dem Fachbereich Human Computation untersucht, die eine effektive und effiziente Organisation Mensch-zentrierter Auswertungen ermöglichen. Die Kernidee ist die Aufteilung der Bewertungsaufgaben in zahlreiche kleine Teilaufgaben, die parallel von Nutzern bearbeitet und gelöst werden können. Die Ergebnisse dieser Teilaufgaben werden zur Lösung der ursprünglichen Aufgabe bzw. des ursprünglichen Problems aggregiert. Das Projekt folgt einem Design Science Ansatz, um Mensch-zentrierte Lösungen zu Bewertungsproblemen zu entwerfen und deren Nutzen für die Bewertung von Ontologien zu evaluieren. Zur Evaluierung der Skalierbarkeit des Ansatzes werden im Rahmen von HOnEst menschliche und algorithmische Komponenten im Kontext zweier großer und praktisch relevanter Ontologien kombiniert: (1) CSO Ontologie, die 15K Forschungsthemen der Informatik enthält und (2) WebIsALOD, die die Diversität von Wissen über Informationssysteme mit 400M automatisch extrahierten taxonomischen Relationen (tail entities) erweitern soll. Tail entities werden derzeit nicht durch Ontologien, wie sie beispielsweise in Wikipedia verwendet werden, unterstützt. In beiden Fällen werden algorithmische Komponenten, wie Klassifikatoren für maschinelles Lernen verwendet, um abzuleiten, welche Teile von Ontologien durch Menschen oder durch Mensch-zentrierte Methoden evaluiert werden sollen. Die Ergebnisse werden zur Verbesserung der eigenen Klassifikationsmethode verwendet.Neben diesen neuenForschungsbeiträgenzu den wissenschaftlichen Bereichen der Ontologieevaluierung und Human Computation, wirdHOnEstwichtige Rückschlüsse aufdas wahrheitsgetreue und unverfälschte Verhalten ontologiebasierter Systeme liefern. Vom Nutzen werden bereits jene Systeme profitieren, die eine der beiden im Rahmen des Projekts verbesserten Ontologien verwenden.
In den letzten Jahren hat die Künstliche Intelligenz (KI) enorme technologische Entwicklungen durchlaufen, die erhebliche Auswirkungen auf alle Aspekte der Gesellschaft haben, von wirtschaftlichen Veränderungen bis hin zu Fragen der Nachhaltigkeit. Insbesondere haben wir den großen Einfluss von KI-Techniken erlebt, die Intelligenz aus großen Datenmengen ableiten (auch bekannt als neuronale KI). Ein wichtiger Vertreter dieses Trends sind Basismodelle (die häufig von Sprachsystemen wie ChatGPT genutzt werden), die die Leistungsfähigkeit dieser Technologien demonstrieren, gleichzeitig aber auch ihre Grenzen aufzeigen, die in der mangelnden Transparenz ihrer internen Funktionsweise und der schwachen sachlichen Korrektheit liegen. Daher stellt sich die zentrale Frage: Wie können wir die enorme Leistungsfähigkeit solcher neuronalen KI-Techniken nutzen und gleichzeitig sicherstellen, dass KI-Systeme transparent bleiben und sich wahrheitsgemäß verhalten, indem sie sachlich korrekte Informationen liefern? Ein Lösungsansatz sind "neurosymbolische" Architekturen, die neuronale Systeme (z. B. Basismodelle) mit faktisch korrektem Wissen ergänzen, das mit symbolischen KI-Techniken erfasst wurde. Insbesondere fortgeschrittene Datenstrukturen, sogenannte Ontologien, eignen sich zur Erfassung von verifiziertem und faktisch korrektem Wissen. Ontologien werden in der Regel automatisch aus umfangreichen Textsammlungen extrahiert und einer Qualitätsprüfung unterzogen, die häufig unter menschlicher Beteiligung erfolgt. Ziel des HOnEst-Projekts ist es, die Qualität von Ontologien durch eine skalierbare, menschenzentrierte Evaluierung (MZE) zu verbessern, so dass sie ein sachlich korrektes und unvoreingenommenes ("honest") Verhalten von KI-Systemen ermöglichen, die auf ihnen aufbauen. Um dieses Ziel zu erreichen, hat das Projekt die folgenden Ergebnisse erzielt. Erstens haben wir zum besseren Verständnis dieses Themas eine systematische Übersicht über 15 Jahre Arbeit im Bereich der menschenzentrierten Ontologieevaluierung erstellt. Zweitens haben wir experimentell Lösungen für die Ontologieevaluierung untersucht, indem wir die Evaluierungsaufgabe in mehrere kleinere Aufgaben, die von einer großen und verteilten Belegschaft parallel gelöst werden können, aufgeteilt haben. Wir haben wiederverwendbare Prozessmodelle und technische Architekturen vorgestellt, die andere für ihre eigenen MZE-Kampagnen nutzen können. Drittens haben wir uns darauf konzentriert, MZE durch die Kombination von menschlichen und algorithmischen Komponenten skalierbar zu machen. Zu diesem Zweck haben wir geeignete neurosymbolische Architekturen untersucht, die Ontologien und neuronale Systeme kombinieren, was zur Identifizierung von über 40 solcher Architekturtypen geführt hat. Außerdem haben wir hybride Mensch-KI-Workflows vorgeschlagen, bei denen Menschen und algorithmische Elemente (insbesondere Basismodelle) zusammenarbeiten, um Ontologien zu verifizieren. Wir haben diese Arbeitsabläufe experimentell für die Überprüfung des Computer Science Knowledge Graph (CS-KG) evaluiert. Der CS-KG ist eine ontologiebasierte, groß angelegte Ressource, die 41 Millionen Fakten über den Bereich der Informatik enthält. Damit hat HOnEst ein wesentliches Teil des übergreifenden Puzzles zur Sicherstellung leistungsfähiger und wahrheitsgetreuer KI-Systeme geliefert und so zur sicheren und effektiven Einführung dieser leistungsstarken Technologien, selbst in kritischen Anwendungsbereichen, in denen faktische Korrektheit entscheidend ist, beigetragen.
- Wirtschaftsuniversität Wien - 100%
- Heiko Paulheim, Universität Mannheim - Deutschland
- Asunción Mari-Carmen Gómez-Pérez, Universidad Politécnica de Madrid - Spanien
- Enrico Motta, The Open University - Vereinigtes Königreich
Research Output
- 100 Zitationen
- 33 Publikationen
- 4 Policies
- 5 Datasets & Models
- 1 Software
- 7 Disseminationen
- 22 Wissenschaftliche Auszeichnungen
- 5 Weitere Förderungen
-
2020
Titel Verifying Extended Entity Relationship Diagrams with Open Tasks DOI 10.1609/hcomp.v8i1.7471 Typ Journal Article Autor Käsznar K Journal Proceedings of the AAAI Conference on Human Computation and Crowdsourcing Link Publikation -
2024
Titel Enhancing Human-in-the-Loop Ontology Curation Results through Task Design DOI 10.1145/3626960 Typ Journal Article Autor Tsaneva S Journal ACM Journal of Data and Information Quality Seiten 1-25 Link Publikation -
2024
Titel Deriving semantic validation rules from industrial standards: An OPC UA study DOI 10.3233/sw-233342 Typ Journal Article Autor Bareedu Y Journal Semantic Web Seiten 517-554 Link Publikation -
2024
Titel Enhancing Machine Learning Predictions Through Knowledge Graph Embeddings DOI 10.1007/978-3-031-71167-1_15 Typ Book Chapter Autor Llugiqi M Verlag Springer Nature Seiten 279-295 -
2022
Titel Hybrid Human-Machine Evaluation of Knowledge Graphs Typ Other Autor Marta Sabou Konferenz Workshop on Human-Centered Design of Symbiotic Hybrid Intelligence, collocated with the first Int. Conf. on Hybrid Human Artificial Intelligence (HHAI) -
2022
Titel A process and tool support for human-centred ontology verification Typ Other Autor Klemens Käsznar Link Publikation -
2020
Titel Effective Crowd-Annotation of Participants, Interventions, and Outcomes in the Text of Clinical Trial Reports DOI 10.18653/v1/2020.findings-emnlp.274 Typ Conference Proceeding Abstract Autor Sabou M Seiten 3064-3074 -
2020
Titel Effective crowd-annotation of participants, interventions, and outcomes in the text of clinical trial reports Typ Other Autor Sabou M. Seiten 3064-3074 Link Publikation -
2020
Titel Empirical Software Engineering Experimentation with Human Computation; In: Contemporary Empirical Methods in Software Engineering DOI 10.1007/978-3-030-32489-6_7 Typ Book Chapter Verlag Springer International Publishing -
2020
Titel DEXA: Supporting Non-Expert Annotators with Dynamic Examples from Experts DOI 10.1145/3397271.3401334 Typ Conference Proceeding Abstract Autor Sabou M Seiten 2109-2112 Link Publikation -
2025
Titel Semantic-Based Data Augmentation for Machine Learning Prediction Enhancement DOI 10.1177/29498732251340160 Typ Journal Article Autor Llugiqi M Journal Neurosymbolic Artificial Intelligence Link Publikation -
2025
Titel Validating Semantic Artifacts with Large Language Models DOI 10.1007/978-3-031-78952-6_9 Typ Book Chapter Autor Tufek N Verlag Springer Nature Seiten 92-101 -
2025
Titel Knowledge graph validation by integrating LLMs and human-in-the-loop DOI 10.1016/j.ipm.2025.104145 Typ Journal Article Autor Tsaneva S Journal Information Processing & Management Seiten 104145 Link Publikation -
2025
Titel Opportunities for Knowledge Graphs in the AI landscape - An application-centric perspective DOI 10.1016/j.websem.2025.100867 Typ Journal Article Autor Presutti V Journal Journal of Web Semantics Seiten 100867 Link Publikation -
2025
Titel Knowledge Engineering in the Age of Neurosymbolic Systems DOI 10.1177/29498732251320078 Typ Journal Article Autor Sabou M Journal Neurosymbolic Artificial Intelligence -
2025
Titel From Experts to LLMs: Evaluating the Quality of Automatically Generated Ontologies Typ Other Autor Ekaputra F.J. Seiten - Link Publikation -
2025
Titel Benchmarking Ontology Validation Capabilities of LLMs Typ Other Autor Herwanto G.B. Seiten - Link Publikation -
2025
Titel Ontology Corpora for LLM-based Knowledge Engineering Research Typ Other Autor Herwanto G.B. Seiten - Link Publikation -
2024
Titel LLM-driven Ontology Evaluation: Verifying Ontology Restrictions with ChatGPT Typ Other Autor Tsaneva S. Seiten 15- Link Publikation -
2024
Titel Enhancing Scientific Knowledge Graph Generation Pipelines with LLMs and Human-in-the-Loop Typ Other Autor Dessì D. Seiten - Link Publikation -
2024
Titel Characteristics of semi-automatic knowledge graph evaluation approaches Typ Other Autor Oliver Liu Link Publikation -
2024
Titel Semi-automatic Knowledge Graph Creation and Evaluation Typ Other Autor Veronika Hiesinger Link Publikation -
2021
Titel Human Computation Approach for Ontology Restrictions Verification Typ Conference Proceeding Abstract Autor Marta Sabou Konferenz AAAI Conference on Human Computation and Crowdsourcing (HComp) Link Publikation -
2021
Titel Human-Centric Ontology Evaluation: A Human Computation approach for ontology restrictions verification Typ Other Autor Stefani Tsaneva Link Publikation -
2021
Titel Hybrid Human-Machine Ontology Verification Typ Other Autor Alexander Prock Link Publikation -
2022
Titel Human-Centric Ontology Evaluation: Process and Tool Support DOI 10.1007/978-3-031-17105-5_14 Typ Book Chapter Autor Tsaneva S Verlag Springer Nature Seiten 182-197 -
2023
Titel Describing and Organizing Semantic Web and Machine Learning Systems in the SWeMLS-KG DOI 10.1007/978-3-031-33455-9_22 Typ Book Chapter Autor Ekaputra F Verlag Springer Nature Seiten 372-389 -
2023
Titel Knowledge-centric Prompt Composition for Knowledge Base Construction from Pre-trained Language Models Typ Other Autor A. Hughes Konferenz KBC-LM'23: Knowledge Base Construction from Pre-trained Language Models workshop at ISWC Link Publikation -
2023
Titel ChatGPT vs Human-in-the-loop: An approach towards automated verification of ontology restrictions Typ Other Autor Stefan Vasic Link Publikation -
2023
Titel Benchmarking human-centric ontology defects Typ Other Autor Marlene Forman Link Publikation -
2023
Titel Using Human Computation for Ontology evaluation Typ Other Autor Orsa Miruna Link Publikation -
2023
Titel Combining Machine Learning and Semantic Web: A Systematic Mapping Study DOI 10.1145/3586163 Typ Journal Article Autor Breit A Journal ACM Computing Surveys Seiten 1-41 Link Publikation -
2025
Titel Large Language Model usage when learning Ontology Engineering Typ Other Autor Tobias Stubreiter Link Publikation
-
2025
Titel Horizon Scanning Workshop on Human-Like AI Systems (European Innovation Council ) Typ Participation in a guidance/advisory committee -
2025
Titel Consultation on Austrian research funding policy Typ Participation in a guidance/advisory committee -
2024
Titel Consultation on Emerging Technology Signals - European Innovation Council Typ Participation in a guidance/advisory committee -
2023
Titel Austrian AI Delegation to Canada Typ Participation in a guidance/advisory committee
-
2024
Link
Titel Knowledge Graph Triple Validation by LLMs and Human-in-the-Loop Typ Database/Collection of data Öffentlich zugänglich Link Link -
2024
Link
Titel Pizza Ontology Axioms Dataset Typ Database/Collection of data Öffentlich zugänglich Link Link -
2024
Link
Titel Human-centric Evaluation of Semantic Resources: Systematic Mapping Study Protocol and Data Typ Database/Collection of data Öffentlich zugänglich Link Link -
2023
Link
Titel HERO (Human-centric ontology Evaluation pROcess) - Process model DOI 10.5281/zenodo.7643356 Typ Computer model/algorithm Öffentlich zugänglich Link Link -
0
Link
Titel Ontology Corpora for LLM-based Knowledge Engineering Research Typ Database/Collection of data Öffentlich zugänglich Link Link
-
2022
Link
Titel Dagstuhl Seminar "Knowledge Graphs and Their Role in the Knowledge Engineering of the 21st Century " Typ A formal working group, expert panel or dialogue Link Link -
2023
Titel Panel on AI Ecosystems Typ A formal working group, expert panel or dialogue -
2023
Link
Titel Panel on "The AI Revolution" Typ A formal working group, expert panel or dialogue Link Link -
2023
Link
Titel WU Magazin Typ A magazine, newsletter or online publication Link Link -
2024
Link
Titel Project website Typ Engagement focused website, blog or social media channel Link Link -
2022
Link
Titel Inaugural Lecture: "Humans - The Future of Artificial Intelligence?" Typ A talk or presentation Link Link -
2023
Link
Titel Panel "Women in Tech Summit" Warsaw Typ A talk or presentation Link Link
-
2025
Titel Keynote Speaket at the BILAI Kick-off Event Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad National (any country) -
2025
Titel Co-Editor of Special Issue on "Knowledge Graphs in the AI landscape - An application-centric perspective" Typ Appointed as the editor/advisor to a journal or book series Bekanntheitsgrad Continental/International -
2025
Titel Research visit Nilay Tüfek Özkaya Typ Attracted visiting staff or user to your research group Bekanntheitsgrad National (any country) -
2025
Titel Keynote Speaker at the IEEE International Conference on Data and Software Engineering (ICoDSE) Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International -
2025
Titel Research visit Gianluca Demartini Typ Attracted visiting staff or user to your research group Bekanntheitsgrad Continental/International -
2025
Titel Research visit Lisa Ehrlinger Typ Attracted visiting staff or user to your research group Bekanntheitsgrad National (any country) -
2024
Titel Advisory Board Member: Austrian Lab for AI Trust (ALAIT) Project Typ Prestigious/honorary/advisory position to an external body Bekanntheitsgrad National (any country) -
2024
Titel Invited Talk at University of Mannheim/Engage.EU Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International -
2024
Titel Advisory Board Member: Josef Ressel Center Industrial Data Lab Typ Prestigious/honorary/advisory position to an external body Bekanntheitsgrad National (any country) -
2024
Titel Advisory Board Member: INTEND Project (EU) Typ Prestigious/honorary/advisory position to an external body Bekanntheitsgrad Continental/International -
2024
Titel Co-editor of Special Issue on Knowledge Graphs and Neurosymbolic AI Typ Appointed as the editor/advisor to a journal or book series Bekanntheitsgrad Continental/International -
2024
Titel Strategic Advisory Board Member: Digital Humanism Association Typ Prestigious/honorary/advisory position to an external body Bekanntheitsgrad National (any country) -
2024
Titel Keynote Speaker "Workshop on Semantic Technologies and Deep Learning Models for Scientific, Technical and Legal Data" Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International -
2024
Titel Research visit Raghava Mutharaju Typ Attracted visiting staff or user to your research group Bekanntheitsgrad Continental/International -
2023
Titel Research visit Paul Groth Typ Attracted visiting staff or user to your research group Bekanntheitsgrad Continental/International -
2023
Titel Board Member: Austrian Society for Artificial Intelligence Typ Prestigious/honorary/advisory position to an external body Bekanntheitsgrad National (any country) -
2023
Titel Editorial Board Member - Neurosymbolic Artificial Intelligence Journal Typ Appointed as the editor/advisor to a journal or book series Bekanntheitsgrad Continental/International -
2023
Titel Research visit María Poveda-Villalón Typ Attracted visiting staff or user to your research group Bekanntheitsgrad Continental/International -
2022
Titel Research visit Frank van Harmelen Typ Attracted visiting staff or user to your research group Bekanntheitsgrad Continental/International -
2022
Titel Research visit Heiko Paulheim Typ Attracted visiting staff or user to your research group Bekanntheitsgrad Continental/International -
2021
Titel Invited Speaker at "Austrian Computer Science Days" Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad National (any country) -
2021
Titel Invited Talk at University of Mannheim Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International
-
2024
Titel Doctoral College on Digital Humanism Typ Research grant (including intramural programme) Förderbeginn 2024 -
2023
Titel PERKS: Eliciting and Exploiting Procedural Knowledge in Industry 5.0 Typ Research grant (including intramural programme) Förderbeginn 2023 -
2021
Titel ORE: OPC UA Rule Editor Typ Research grant (including intramural programme) Förderbeginn 2021 -
2025
Titel Visiting Student Grant for Ms. Stefani Tsaneva Typ Travel/small personal Förderbeginn 2025 Geldgeber ARC Industrial Transformation Training Centre for Information Resilience (CIRES) -
2025
Titel WU International Research Fellow (WU IRF) - Ms. Stefani Tsaneva Typ Travel/small personal Förderbeginn 2025