Multimedia und Benutzerglaubwürdigkeit Wissensextraktion
Multimedia and User Credibility Knowledge Extraction
ERA-Net: CHIST ERA
Wissenschaftsdisziplinen
Informatik (80%); Mathematik (20%)
Keywords
-
Multimedia,
User Credibility,
Concept Similarity,
Information Fusion
Web 3.0 ist bereits seit mehr als 5 Jahren ein gängiger Begriff. Obwohl die exakte Definition noch unklar ist, wurde im letzten halben Jahrzehnt klar, dass das Web eine tragende Säule für Social Media geworden ist. Anwender können Ihre Multimedia-Daten direkt von Kameras, Telefonen, Tablets oder Computern an ihre Bekannten und die ganze Welt versenden. Das MUCKE Projekt befasst sich mittels neuen und zuverlässigen Modellen zur Wissensextraktion, die für die mehrsprachigen und multimodalen Daten in sozialen Netzwerken konzipiert sind, mit diesem Strom an multimedialen sozialen Daten. Das Projekt verabschiedet sich dabei von aktuellen Wissensextraktionsmodellen, die zumeist quantitativ orientiert sind, und setzt den Schwerpunkt auf die Qualität der verarbeitenden Daten, um den Benutzer nicht einer Fülle an thematisch gleich relevanten Daten auszusetzen. Dies wird mit zwei zentralen Neuerungen erreicht: durch automatische Abschätzung der Glaubwürdigkeit anderer Benutzer für Multimedia- Streams, und durch ein adaptives Konzept von multimedialer Ähnlichkeit. Glaubwürdigkeitsmodelle für Multimedia-Streams sind ein völlig neues Forschungsthema, welches in einen Multimedia Information Fusion Task münden wird, der der wichtigste Forschungsbeitrag des Projektes sein wird. Adaptive Konzepte für multimediale Ähnlichkeit unterscheiden sich von existierenden Modellen dadurch, dass eine semantische Repräsentation der zugrundeliegenden Korpora erstellt wird, und darauf ein probabilistisches System angewandt wird. Die Nützlichkeit dieser beiden Innovationen wird in einen Image-Retrieval-System demonstriert werden. Um die Zuverlässigkeit des extrahierten Wissens zu bewerten wird eine ausführliche Evaluierung mit Hilfe von repräsentativen Datensätzen durchgeführt. Zusätzlich wird ein neuer, gemeinsamer Evaluierungs-Task, der sich auf die Abschätzung von Benutzerglaubwürdigkeit konzentriert, vorgeschlagen. Die zwei Hauptinnovationen stützen sich auf innovative Text- und Bildverarbeitung, sowie auf Methoden zur Kombination der beiden. In der Textverarbeitung wird der Fokus auf Aufgaben wie Disambiguierung von Begriffen, Erkennung von Konzepten und die Auflösung von Anaphern liegen. Die Schwerpunkte in der Bildverarbeitung werden kompakte Inhaltsdeskriptoren, Konzepterkennung und die Robustheit von Detektoren beinhalten. Die Fusion von Multimedia-Daten wird sich hauptsächlich auf flexible Kombination der Text- und Bildmodalitäten, basierend auf einem probabilistischen System, konzentrieren. Die vorgeschlagenen Methoden werden so ausgelegt, dass sie von der Struktur von sozialen Netzwerken profitieren können. Ein besonderer Fokus wird auf die Entwicklung von skalierbaren Algorithmen gelegt, die mit großen, heterogenen Datensätzen umgehen können. Das Konsortium besteht aus vier Partnern - drei Universitäten und ein Forschungsinstitut - mit komplementären Kompetenzen, die die Forschungsgebiete des Projekts abdecken. Im MUCKE Projekt werden sie gemeinsam neue Modelle zur Verarbeitung von unsauberen Multimedia- und multimodalen Daten entwickeln, die die Basis für innovative Dienste darstellen werden.
Welche online Informationen sind glaubwürdig? Verstehen Computer, was sie lesen? Das sind die Fragen, die die Grundlagen der wissenschaftlichen Untersuchungen des MUCKE Projektes dargestellt haben. MUCKE war eine internationale Zusammenarbeit zwischen Universitäten und Forschungsorganisationen in Österreich, Frankreich, Rumänien und der Türkei, geleitet von der TU Wien. Text- und Bildverarbeitung hat in den letzten fünf Jahren eine neue Ebene erreicht. Unter dem neuen Titel Deep Learning oder Convolutional Neuronale Netze haben die Methoden der künstlichen Intelligenz der zweiten Hälfte des 20. Jahrhunderts eine Wiederauferstehung erlebt. Diese Methoden demonstrieren in einigen Anwendungsfällen eine beeindruckende Fähigkeit Verstehen zu simulieren. Im MUCKE Projekt haben wir diese Methoden an einen für die meisten Benutzer sehr vertrauten Anwendungsfall: die Fotografie (beispielsweise auf Websites wie Flickr), adaptiert. Wir haben gezeigt, wie sie verwendet werden können, um die Genauigkeit der Etiketten (Tags) der Fotos, die von Benutzern eingegeben werden, zu überprüfen. In umfangreichen Tests wurde gezeigt, dass solche Methoden Foto-Tags mit einer ähnlichen Qualität wie Menschen generieren können. Mit diesen Methoden können wir auch das Langzeitverhalten der Tagging-Aktivität von Menschen beobachten und die Glaubwürdigkeit der Tags abschätzen. Während diese Methoden einen Durchbruch darstellt, ist es nicht ohne weiteres ersichtlich, wie diese Ansätze auf andere Anwendungsfälle anzuwenden sind. Die Themen eHealth oder Patentschutz, in denen die Fragen der Glaubwürdigkeit und der Semantik sehr wichtig sind, stellen uns nicht nur vor neue und spannende Herausforderungen, sondern auch vor hohe Belohnungen: Verbesserung des Zugangs zu vertrauenswürdigen medizinischen Informationen für Patienten, Allgemeinmedizinern und Spezialisten, und steigender Innovationsgrad. Es besteht allerdings keine Gefahr, dass Maschinen bald in der Lage sein werden, hoch kognitive Funktionen des menschlichen Verstandes zu ersetzen die notwendige Sammlung von Menschenverstand ist jenseits der Fähigkeiten von Maschinen, trotz der Versprechungen von Big Data.
- Technische Universität Wien - 100%
- Adrian Popescu, Commissariat à l´Energie Atomique (CEA) - Frankreich
- Adrian Iftene, University Alexandru-Ioan-Cuza at Iasi - Rumänien
- Pinar Duygulu-Sahin, Bilkent University - Türkei
Research Output
- 184 Zitationen
- 34 Publikationen
-
2015
Titel Leveraging Metropolis-Hastings Algorithm on Graph-based Model for Multimodal IR. Typ Conference Proceeding Abstract Autor Rauber A Et Al Konferenz GSB@SIGIR 2015 -
2015
Titel TUW@ TREC clinical decision support track. Typ Conference Proceeding Abstract Autor Hanbury A Et Al Konferenz Proceedings of the 2014 Text Retrieval Conference. -
2015
Titel Div150Cred: A social image retrieval result diversification with user tagging credibility dataset. Typ Conference Proceeding Abstract Autor Ionescu B Konferenz MMSys 2015 -
2014
Titel A review of users' search contexts for lifelogging system design DOI 10.1145/2637002.2637040 Typ Conference Proceeding Abstract Autor Liu Y Seiten 271-274 -
2015
Titel Credibility in Information Retrieval DOI 10.1561/1500000046 Typ Journal Article Autor Ginsca A Journal Foundations and Trends® in Information Retrieval Seiten 355-475 -
2015
Titel On the use of statistical semantics for metadata-based social image retrieval. Typ Conference Proceeding Abstract Autor Lupu M Et Al Konferenz Proc. Content-Based Multimiedia Imaging (CBMI) 2015 -
2015
Titel Reachability Analysis of Graph Modelled Collections DOI 10.1007/978-3-319-16354-3_41 Typ Book Chapter Autor Sabetghadam S Verlag Springer Nature Seiten 370-381 -
2015
Titel Diagnose This If You Can DOI 10.1007/978-3-319-16354-3_62 Typ Book Chapter Autor Zuccon G Verlag Springer Nature Seiten 562-567 -
2015
Titel Evaluating User Image Tagging Credibility DOI 10.1007/978-3-319-24027-5_4 Typ Book Chapter Autor Ginsca A Verlag Springer Nature Seiten 41-52 -
2015
Titel TUW @ MediaEval 2015 Retrieving Diverse Social Images Task. Typ Conference Proceeding Abstract Autor Hanbury A Et Al Konferenz MediaEval 2015. -
2015
Titel Retrieving Diverse Social Images at MediaEval 2015: Challenge, Dataset and Evaluation. Typ Conference Proceeding Abstract Autor Ionescu B Konferenz MediaEval 2015. -
2015
Titel On the Use of Statistical Semantics for Metadata-Based Social Image Retrieval DOI 10.1109/cbmi.2015.7153634 Typ Conference Proceeding Abstract Autor Rekabsaz N Seiten 1-4 Link Publikation -
2015
Titel CLEF eHealth evaluation lab 2015, task 2: Retrieving information about medical symptoms. Typ Conference Proceeding Abstract Autor Palotti J -
2015
Titel Div150Cred DOI 10.1145/2713168.2713192 Typ Conference Proceeding Abstract Autor Ionescu B Seiten 207-212 -
2015
Titel How users search and what they search for in the medical domain DOI 10.1007/s10791-015-9269-8 Typ Journal Article Autor Palotti J Journal Information Retrieval Journal Seiten 189-224 Link Publikation -
2015
Titel Toward Optimized Multimodal Concept Indexing DOI 10.1007/978-3-319-27932-9_13 Typ Book Chapter Autor Rekabsaz N Verlag Springer Nature Seiten 141-152 -
2014
Titel A Combined Approach of Structured and Non-structured IR in Multimodal Domain DOI 10.1145/2578726.2578801 Typ Conference Proceeding Abstract Autor Sabetghadam S Seiten 491-494 Link Publikation -
2014
Titel Retrieving Diverse Social Images at MediaEval 2014: Challenge, Dataset and Evaluation. Typ Conference Proceeding Abstract Autor Ionescu B Konferenz MediaEval 2014 -
2014
Titel User intent behind medical queries DOI 10.1145/2637002.2637043 Typ Conference Proceeding Abstract Autor Palotti J Seiten 283-286 Link Publikation -
2014
Titel TUW@ Retrieving Diverse Social Images Task 2014. Typ Conference Proceeding Abstract Autor Hanbury A Et Al Konferenz MediaEval. 2014 -
2014
Titel A System Framework for Concept- and Credibility-Based Multimedia Retrieval DOI 10.1145/2578726.2582624 Typ Conference Proceeding Abstract Autor Bierig R Seiten 543-546 Link Publikation -
2014
Titel Which One to Choose: Random Walks or Spreading Activation? DOI 10.1007/978-3-319-12979-2_11 Typ Book Chapter Autor Sabetghadam S Verlag Springer Nature Seiten 112-119 -
2014
Titel Insight to Hyponymy Lexical Relation Extraction in the Patent Genre Versus Other Text Genres. Typ Conference Proceeding Abstract Autor Anderson L Konferenz IPaMin@ KONVENS -
2014
Titel Exploiting health related features to infer user expertise in the medical domain. Typ Conference Proceeding Abstract Autor Müller H Et Al Konferenz Web Search Click Data workshop at WSCM, New York City, NY, USA. 2014. -
2017
Titel A faceted approach to reachability analysis of graph modelled collections DOI 10.1007/s13735-017-0145-8 Typ Journal Article Autor Sabetghadam S Journal International Journal of Multimedia Information Retrieval Seiten 157-171 Link Publikation -
2016
Titel TUW@ TREC Clinical Decision Support Track 2015. Typ Conference Proceeding Abstract Autor Hanbury A Konferenz Proceedings of the 2015 Text Retrieval Conference. -
2016
Titel Building Evaluation Datasets for Consumer-Oriented Information Retrieval. Typ Conference Proceeding Abstract Autor Goeuriot L Konferenz Proc. of Language Resources and Evaluation Conference (LREC) 2016 -
2016
Titel Div150Multi: a social image retrieval result diversification dataset with multi-topic queries. Typ Conference Proceeding Abstract Autor Ionescu B Konferenz MMSys 2016 -
0
Titel Dataset: Div150Multi: A Social Image Retrieval Result Diversification Dataset with Multi-topic Queries (2016). Typ Other -
0
Titel Dataset: Div400: A Social Image Retrieval Result Diversification Dataset (2014). Typ Other -
0
Titel Open Source Software: MUCKE Information Retrieval Evaluation System (2016). Typ Other -
0
Titel Dataset: Div150Cred: A Social Image Retrieval Result Diversification with User Tagging Credibility Dataset (2015). Typ Other -
0
DOI 10.1145/2578726 Typ Other -
0
DOI 10.1145/2637002 Typ Other