Integrierte Human Computation für Wissensextraktion und -evaluierung
Embedded Human Computation for Knowledge Extraction and Evaluation
ERA-Net: CHIST ERA
Wissenschaftsdisziplinen
Informatik (100%)
Keywords
-
Human Computation,
Natural Language Proceesing,
Knowledge Resource Acquisition,
Ontology Engineering,
Open Evaluation Methods,
Heterogeneous Web Data
Etablierte Wissensextraktionsverfahren sind dem schnellen Wachstum und dem fragmentierten Charakter sozialer Medien und strukturierter Online-Quellen vielfach nicht gewachsen. Verrauschte, multilinguale oder widersprüchliche Input-Daten sind besonders problematisch. Ohne entsprechende Trainingsdaten und Gold Standards können Reliabilität und Skalierbarkeit dieser Algorithmen nicht gesteigert werden. Menschliche Benutzer hingegen sind in der Interpretation widersprüchlicher und kontextabhängiger Informationen unerreicht. Das uComp Projekt wird diese Fähigkeit nutzbar machen und kollektive Intelligenz mit automatisierten Methoden kombinieren. Basierend auf dem Human Computation Ansatz wird ein skalierbares und generisches Framework zur Extraktion und Evaluierung von Wissen auf Basis von "Games with a Purpose" und Crowdsourcing Plattformen entwickelt. Dieses Framework wird es erlauben, besonders herausfordernde Fragestellungen einer grossen Zahl von Benutzern zu präsentieren und mit Hilfe deren Feedbacks automatisierte Methoden iterativ zu verbessern. Dies ist ein zentraler Beitrag des Projekts, welcher die Forschungsgebiete der menschlichen und automatisierten Informationsverarbeitung verknüpft und vorantreibt. Der gewählte Ansatz geht weit über die reine Datenakquisition hinaus und erlaubt es, adaptive Wissensextraktionsprozesse zu optimieren. Eine offene Kampagne zur Evaluierung der entwickelten Algorithmen wird deren Präzision und Skalierbarkeit messen - nicht nur im Hinblick auf Fakten, sondern auch um emotionales Wissen effektiv zu extrahieren. Neben innovativen Verfahren zur Evaluierung wird das uComp Projekt auch eine gemeinsame Datenbasis zur Verfügung stellen und den gewählten Ansatz mit traditionellen Verfahren zur Wissensextraktion vergleichen. Die von uComp entwickelten Methoden sind generisch konzipiert und daher auf beliebige Themenbereiche anwendbar. Aufgrund der Relevanz und inhaltlichen Komplexität wurde Klimawandel als primäres Anwendungsbeispiel gewählt. Das Thema ist durch wechselhafte und vielfach widersprüchliche Interpretationen geprägt. Führende internationale Organisationen (European Environment Agency, British Library, NASA Ames Research Center und NOAA Climate Program Office) werden umfangreiche Datenarchive zur Verfügung stellen und Klimawandel-Experten im Rahmen der Evaluierung vermitteln. Darüber hinaus werden diese Kooperationen den Impact und die internationale Sichtbarkeit des Projekts erhöhen.
Das schnelle Wachstum und der fragmentierte Charakter sozialer Medien stellen etablierte Wissensextraktionsverfahren vor hohe Herausforderungen. Verrauschte, multilinguale oder widersprüchliche Input-Daten sind besonders problematisch. Ohne Trainingsdaten und Gold Standards können Reliabilität und Skalierbarkeit dieser Algorithmen nicht beurteilt und weiter gesteigert werden. Menschliche Benutzer hingegen sind in der Interpretation widersprüchlicher und kontextabhängiger Informationen unerreicht. Das uComp Projekt widmete sich diesem Problem und zielte darauf ab, diese Fähigkeit nutzbar zu machen und kollektive Intelligenz mit automatisierten Methoden ergänzend zu kombinieren. Dafür hat uComp ein generisches Human Computing (HC) Framework zur Wissensextraktion und -bewertung entwickelt, basierend auf einer Kombination von "Games with a Purpose" und Crowdsourcing Marktplätzen wie CrowdFlower. Dieses Framework erlaubt es, die schwierigsten Aufgaben zur Bearbeitung an Online-Benutzer zu delegieren und von deren Feedback zu lernen, um automatische Methoden zur Wissensextraktion iterativ zu verbessern. Die von uComp entwickelten Methoden sind generischer Natur und vielfältig anwendbar. Das Thema Klimawandel wurde als konkrete Anwendung gewählt, da es aufgrund seiner Dynamik und vielfach widersprüchlichen Interpretationen besonders anspruchsvoll ist.Die aktive Zusammenarbeit zwischen dem Institut für Neue Medientechnologie der MODUL University Vienna und internationalen Partnerorganisationen hatte einen positiven Einfluss auf den wissenschaftlichen Fortschritt und half, die internationale Sichtbarkeit des Projekts zu stärken. Die Liste der Partnerorganisationen beinhaltet neben den uComp-Projektpartnern auch das Konsortium von DecarboNet.eu (ein im 7. EU Rahmenprogramm gefördertes Forschungsprojekt), die US-Klimabehörde NOAA (National Oceanic and Atmospheric Administration) sowie das Umweltprogramm der Vereinten Nationen (UNEP).Drei öffentliche Web-Anwendungen haben die Ergebnisse der Zusammenarbeit einem größeren Publikum frei zugänglich gemacht: (1) das Language Quiz zur Erstellung und Validierung lexikalischer Ressourcen, (2) die Climate Challenge zum Verständnis vorherrschender Meinungen und zur Bewusstseinsbildung im Bereich Umwelt- und Klimaschutz, sowie (3) die Media Watch on Climate Change, eine umfangreiches Wissensarchiv mit einem leistungsfähigen visuellen Dashboard zur interaktiven Analyse von Trends und Zusammenhängen. Diese Anwendungen garantieren eine kritische Masse an Input-Daten, motivieren Benutzer zur Auseinandersetzung mit dem Thema, und fördern die Verbreitung des Embedded Human Computation (EHC) Ansatzes bei unterschiedlichen Zielgruppen.
- Modul Univ. Vienna - 100%
- Patrick Paroubek, The Computer Sciences Laboratory for Mechanics and Engineering Sciences - Frankreich
- Wim Peters, University of Sheffield - Vereinigtes Königreich
Research Output
- 188 Zitationen
- 15 Publikationen
- 1 Ausgründungen
-
2013
Titel Knowledge capture from multiple online sources with the extensible web retrieval toolkit (eWRT) DOI 10.1145/2479832.2479861 Typ Conference Proceeding Abstract Autor Weichselbraun A Seiten 129-132 Link Publikation -
2013
Titel Crowdsourced Knowledge Acquisition: Towards Hybrid-Genre Workflows DOI 10.4018/ijswis.2013070102 Typ Journal Article Autor Sabou M Journal International Journal on Semantic Web and Information Systems (IJSWIS) Seiten 14-41 -
2013
Titel Games with a Purpose or Mechanised Labour? DOI 10.1145/2494188.2494210 Typ Conference Proceeding Abstract Autor Sabou M Seiten 1-8 -
2013
Titel Extracting knowledge from the web and social media for progress monitoring in public outreach and science communication DOI 10.1145/2526188.2526219 Typ Conference Proceeding Abstract Autor Scharl A Seiten 121-124 Link Publikation -
2013
Titel Rule-based opinion target and aspect extraction to acquire affective knowledge DOI 10.1145/2487788.2487994 Typ Conference Proceeding Abstract Autor Gindl S Seiten 557-564 Link Publikation -
2016
Titel Application Design and Engagement Strategy of a Game with a Purpose for Climate Change Awareness DOI 10.1007/978-3-319-45982-0_9 Typ Book Chapter Autor Scharl A Verlag Springer Nature Seiten 97-104 -
2016
Titel Analyzing the public discourse on works of fiction – Detection and visualization of emotion in online coverage about HBO’s Game of Thrones DOI 10.1016/j.ipm.2015.02.003 Typ Journal Article Autor Scharl A Journal Information Processing & Management Seiten 129-138 Link Publikation -
2016
Titel Extracting Opinion Targets from Environmental Web Coverage and Social Media Streams DOI 10.1109/hicss.2016.133 Typ Conference Proceeding Abstract Autor Weichselbraun A Seiten 1040-1048 Link Publikation -
2015
Titel Climate Challenge - Raising Collective Awareness in the Tradition of Games with a Purpose. Typ Conference Proceeding Abstract Autor Herring D Et Al Konferenz Proceedings of the 14th Brazilian Symposium on Human Factors in Computer Systems (IHC-2015) -
2014
Titel Enriching semantic knowledge bases for opinion mining in big data applications DOI 10.1016/j.knosys.2014.04.039 Typ Journal Article Autor Weichselbraun A Journal Knowledge-Based Systems Seiten 78-85 Link Publikation -
2014
Titel Metadata Enriched Visualization of Keywords in Context. Typ Conference Proceeding Abstract Autor Fischl D Konferenz Sixth ACM SIGCHI Symposium on Engineering Interactive Computing Systems (EICS-2014) -
2014
Titel Visualizing Contextual Information in Aggregated Web Content Repositories DOI 10.1109/laweb.2014.18 Typ Conference Proceeding Abstract Autor Scharl A Seiten 114-118 Link Publikation -
2014
Titel Visualizing Knowledge Along Semantic and Geographic Dimensions: A Web Intelligence Platform to Explore Climate Change Coverage DOI 10.1007/978-1-4471-6470-8_19 Typ Book Chapter Autor Scharl A Verlag Springer Nature Seiten 423-441 -
2014
Titel Corpus Annotation through Crowdsourcing: Towards Best Practice Guidelines. Typ Conference Proceeding Abstract Autor Sabou M Konferenz Proceedings of the 9th Language Resources & Evaluation Conference (LREC-2014) -
2014
Titel Metadata enriched visualization of keywords in context DOI 10.1145/2607023.2611451 Typ Conference Proceeding Abstract Autor Fischl D Seiten 193-196 Link Publikation