V-Know Collaborative knowledge base debugged and refinement
V-Know Collaborative knowledge base debugged and refinement
Wissenschaftsdisziplinen
Informatik (100%)
Keywords
-
Knowledge-based systems,
Model-based diagnosis,
Debugging,
Knowledge and constraint acquisition,
Virtual communities
Intelligente, wissensbasierte Systeme sind mittlerweile bereits vielfach im praktischen Einsatz: Modell-basierte Systeme diagnostizieren Fehler in unseren Autos, Konfiguratoren helfen uns bei der Zusammensetzung von komplexen Produkten aus einfacheren Einzelteilen, Empfehlungssysteme generieren automatisch Kaufvorschläge auf Basis unserer Wünsche und Bedürfnisse, um nur einige Beispiele zu nennen. Das Wissensakquisitionsproblem war im Kontext solcher Anwendungen stets von fundamentaler Bedeutung und war daher auch schon in der Vergangenheit ein zentrales Element der Forschung in diesem Bereich, wobei der Schwerpunkt vorwiegend auf Fragen der Wissensrepräsentation und -konzeptualisierung sowie auf geeigneten Vorgehensmodellen zur Formalisierung des Expertenwissens lag. In bisherigen Ansätzen ist man weitgehend davon ausgegangen, dass das Wissen an einer zentralen Stelle, mit einer bestimmten Konzeptualisierung und letztlich auch mit einem einzigen (benutzerfreundlichen) Software-Werkzeug formalisiert werden kann. In vielen realen Anwendungen ist es jedoch so, dass das notwendige Domänenwissen in den Köpfen mehrerer Beteiligter verteilt ist. Typische Beispiele hierfür sind abteilungsübergreifende oder interorganisationale Geschäftsprozesse, aber auch neuere, web-basierte Anwendungen, in denen verteilte Benutzergemeinschaften (communities) ihr Wissen in einem innovativen, web-basierten Umfeld mit anderen teilen. Erst in letzter Zeit - mit dem Aufkommen von Web 2.0 Technologien und der Idee des Semantic Web - rücken die Möglichkeiten und Herausforderungen eines kollaborativen Wissenserwerbsprozesses im Web wieder verstärkt in den Mittelpunkt. In der derzeitigen Forschung in diesem Bereich ist jedoch zu beobachten, dass der Schwerpunkt derzeit auf dem Wissenserwerb von "strukturellen" Aspekten, d.h. von Konzepten, Begriffen und Zusammenhängen untereinander, liegt. Das vorgeschlagene V-KNOW Projekt baut auf den derzeitigen Entwicklungen auf, geht aber einen Schritt weiter und zielt darauf ab, Methoden für den kollaborativen Wissenserwerb von domänenspezifischen Randbedingungen (constraints) und Geschäftsregeln (business rules) bereitzustellen, welche in vielen Anwendungen von wissensbasierten Systemen den größten Teil der Erstellungs- und Wartungskosten verursachen. Das Projekt soll unter anderem auf die folgenden Fragen Antwort geben: Wie können Konflikte automatisch erkannt und aufgelöst werden, wenn der Wissenserwerb dezentral durch unterschiedliche Personen erfolgt? Wie können wir den Fachexperten in der Formulierung seines Wissens durch geeignete systemseitige Rückfragen unterstützen, wobei darauf abzuzielen ist, die Menge an notwendigen Interaktionszyklen zu minimieren? Wie kann ein intelligentes System "gute" Reparaturvorschläge auf Basis unterschiedlicher, möglicherweise nur partiell definierter Wissensfragmente erzeugen, die für die verschiedenen Beteiligten plausibel sind? Die Ergebnisse des vorgeschlagenen Projekts sind daher einerseits Methoden und Algorithmen, mit Hilfe derer diese Fragestellungen beantwortet werden können, sowie eine Evaluation, die auf Basis einer prototypischen Realisierung eines solchen Systems erfolgen wird.
Die gemeinsame Entwicklung von Wissensbasen (WB) durch ein Team von Experten ist eine komplexe und zeitaufwendige Aufgabe. Ziel dieses Prozesses ist eine gemeinschaftlich genutzte Formalisierung eines Bereichs durch logische Beschreibungen (Ontologien). Um diesen Prozess zu verbessern, wurden im V-Know Projekt Methoden erforscht und Werkzeuge entwickelt, die die Wissensakquisition sowie die Wartung von Ontologien effizienter gestalten. Die Untersuchung wurde in drei Hauptrichtungen durchgeführt: a) das Debugging von (bzw. die Fehlerlokalisierung in) Wissensbasen, b) das Lernen von logischen Formeln und c) die Gewinnung von faktischem Wissen aus dem Web. Effektive Debugging-Systeme sind die Grundvoraussetzung für die erfolgreiche Entwicklung von wissensbasierten Systemen. Während der Projektlaufzeit entwickelten wir eine Vielzahl von Debugging-Verfahren, mit denen es möglich ist, eine Menge von logischen Formeln zu identifizieren, welche vorgegebene Anforderungen und Testfälle nicht erfüllen. Das Hauptergebnis war die Entwicklung eines interaktiven Fehlersuchalgorithmus zur effizienten Lokalisierung von Fehlern. In üblichen Anwendungsfällen liefern Debugging-Methoden eine Vielzahl an Axiomen der Ontologie, die fehlerhaft sein können (Diagnosen). Unser Debugging-Ansatz holt gezielt zusätzliche Information von den Experten ein, um zwischen den Diagnosen möglichst effizient zu unterscheiden. In weiterer Folge wird diese Information dazu benützt, um eindeutig jenen Teil der Ontologie zu identifizieren, der geändert werden muss, sodass alle Anforderungen der Experten erfüllt werden. Gegenwärtige Lernmethoden haben im Umfeld des V-Know Anwendungsszenarios nur eine begrenzte Anwendbarkeit, da die notwendigen Datenmengen zum Zeitpunkt der Ontologie Entwicklung nicht vorhanden sind. Deshalb haben wir eine neuartige Lernmethode entwickelt, welche auf einer ähnlichen Idee wie im Debbuging-Ansatz basiert. Die Methode generiert Folgerungen aus der Wissensbasis, deren Korrektheit von den Experten klassifiziert wird, wobei zusätzlich Begründungen für die Klassifikation gegeben werden können. Diese Informationen werden verwendet, um logische Formeln zu generieren, die das neu erlangte Wissen ausdrücken. Für die Entwicklung und Wartung von Wissensbasen ist die Gewinnung von Faktenwissen eine zentrale Aufgabe. In V-Know haben wir Methoden zur Gewinnung von Faktenwissen auf Basis von tabellenartigen, im Web publizierten Daten untersucht und ein Web-mining Framework entwickelt. Es enthält fokussierte Web crawler, die relevante Webseiten mit Tabellen ausfindig machen, sowie Algorithmen zur automatischen Erkennung und Extraktion von tabellenartigen Daten.
- Universität Klagenfurt - 100%
Research Output
- 96 Zitationen
- 5 Publikationen
-
2009
Titel Argumentation based constraint acquisition DOI 10.1109/icdm.2009.62 Typ Conference Proceeding Abstract Autor Shchekotykhin K Seiten 476-482 -
2009
Titel Minimization of Product Utility Estimation Errors in Recommender Result Set Evaluations DOI 10.1109/wi-iat.2009.11 Typ Conference Proceeding Abstract Autor Teppan E Seiten 20-27 -
2009
Titel Automated ontology instantiation from tabular web sources—The AllRight system DOI 10.1016/j.websem.2009.04.002 Typ Journal Article Autor Jannach D Journal Web Semantics: Science, Services and Agents on the World Wide Web Seiten 136-153 -
2008
Titel xCrawl: A High-Recall Crawling Method for Web Mining DOI 10.1109/icdm.2008.121 Typ Conference Proceeding Abstract Autor Shchekotykhin K Seiten 550-559 -
2012
Titel Interactive ontology debugging: Two query strategies for efficient fault localization DOI 10.1016/j.websem.2011.12.006 Typ Journal Article Autor Shchekotykhin K Journal Web Semantics: Science, Services and Agents on the World Wide Web Seiten 88-103 Link Publikation