Projektdetail

Grant-DOI 10.55776/I1094
Bewilligungssumme International - Multilaterale Initiativen
Status beendet
Projektbeginn 01.10.2012
Projektende 30.04.2016
Bewilligungssumme 417.819 €

weitere EU-Initiativen: CHIST-ERA

Wissenschaftsdisziplinen

Informatik (80%); Mathematik (20%)

Keywords

Multimedia,
User Credibility,
Concept Similarity,
Information Fusion

Abstract

Zusammenfassung

Web 3.0 ist bereits seit mehr als 5 Jahren ein gängiger Begriff. Obwohl die exakte Definition noch unklar ist, wurde im letzten halben Jahrzehnt klar, dass das Web eine tragende Säule für Social Media geworden ist. Anwender können Ihre Multimedia-Daten direkt von Kameras, Telefonen, Tablets oder Computern an ihre Bekannten und die ganze Welt versenden. Das MUCKE Projekt befasst sich mittels neuen und zuverlässigen Modellen zur Wissensextraktion, die für die mehrsprachigen und multimodalen Daten in sozialen Netzwerken konzipiert sind, mit diesem Strom an multimedialen sozialen Daten. Das Projekt verabschiedet sich dabei von aktuellen Wissensextraktionsmodellen, die zumeist quantitativ orientiert sind, und setzt den Schwerpunkt auf die Qualität der verarbeitenden Daten, um den Benutzer nicht einer Fülle an thematisch gleich relevanten Daten auszusetzen. Dies wird mit zwei zentralen Neuerungen erreicht: durch automatische Abschätzung der Glaubwürdigkeit anderer Benutzer für Multimedia- Streams, und durch ein adaptives Konzept von multimedialer Ähnlichkeit. Glaubwürdigkeitsmodelle für Multimedia-Streams sind ein völlig neues Forschungsthema, welches in einen Multimedia Information Fusion Task münden wird, der der wichtigste Forschungsbeitrag des Projektes sein wird. Adaptive Konzepte für multimediale Ähnlichkeit unterscheiden sich von existierenden Modellen dadurch, dass eine semantische Repräsentation der zugrundeliegenden Korpora erstellt wird, und darauf ein probabilistisches System angewandt wird. Die Nützlichkeit dieser beiden Innovationen wird in einen Image-Retrieval-System demonstriert werden. Um die Zuverlässigkeit des extrahierten Wissens zu bewerten wird eine ausführliche Evaluierung mit Hilfe von repräsentativen Datensätzen durchgeführt. Zusätzlich wird ein neuer, gemeinsamer Evaluierungs-Task, der sich auf die Abschätzung von Benutzerglaubwürdigkeit konzentriert, vorgeschlagen. Die zwei Hauptinnovationen stützen sich auf innovative Text- und Bildverarbeitung, sowie auf Methoden zur Kombination der beiden. In der Textverarbeitung wird der Fokus auf Aufgaben wie Disambiguierung von Begriffen, Erkennung von Konzepten und die Auflösung von Anaphern liegen. Die Schwerpunkte in der Bildverarbeitung werden kompakte Inhaltsdeskriptoren, Konzepterkennung und die Robustheit von Detektoren beinhalten. Die Fusion von Multimedia-Daten wird sich hauptsächlich auf flexible Kombination der Text- und Bildmodalitäten, basierend auf einem probabilistischen System, konzentrieren. Die vorgeschlagenen Methoden werden so ausgelegt, dass sie von der Struktur von sozialen Netzwerken profitieren können. Ein besonderer Fokus wird auf die Entwicklung von skalierbaren Algorithmen gelegt, die mit großen, heterogenen Datensätzen umgehen können. Das Konsortium besteht aus vier Partnern - drei Universitäten und ein Forschungsinstitut - mit komplementären Kompetenzen, die die Forschungsgebiete des Projekts abdecken. Im MUCKE Projekt werden sie gemeinsam neue Modelle zur Verarbeitung von unsauberen Multimedia- und multimodalen Daten entwickeln, die die Basis für innovative Dienste darstellen werden.

Welche online Informationen sind glaubwürdig? Verstehen Computer, was sie lesen? Das sind die Fragen, die die Grundlagen der wissenschaftlichen Untersuchungen des MUCKE Projektes dargestellt haben. MUCKE war eine internationale Zusammenarbeit zwischen Universitäten und Forschungsorganisationen in Österreich, Frankreich, Rumänien und der Türkei, geleitet von der TU Wien. Text- und Bildverarbeitung hat in den letzten fünf Jahren eine neue Ebene erreicht. Unter dem neuen Titel Deep Learning oder Convolutional Neuronale Netze haben die Methoden der künstlichen Intelligenz der zweiten Hälfte des 20. Jahrhunderts eine Wiederauferstehung erlebt. Diese Methoden demonstrieren in einigen Anwendungsfällen eine beeindruckende Fähigkeit Verstehen zu simulieren. Im MUCKE Projekt haben wir diese Methoden an einen für die meisten Benutzer sehr vertrauten Anwendungsfall: die Fotografie (beispielsweise auf Websites wie Flickr), adaptiert. Wir haben gezeigt, wie sie verwendet werden können, um die Genauigkeit der Etiketten (Tags) der Fotos, die von Benutzern eingegeben werden, zu überprüfen. In umfangreichen Tests wurde gezeigt, dass solche Methoden Foto-Tags mit einer ähnlichen Qualität wie Menschen generieren können. Mit diesen Methoden können wir auch das Langzeitverhalten der Tagging-Aktivität von Menschen beobachten und die Glaubwürdigkeit der Tags abschätzen. Während diese Methoden einen Durchbruch darstellt, ist es nicht ohne weiteres ersichtlich, wie diese Ansätze auf andere Anwendungsfälle anzuwenden sind. Die Themen eHealth oder Patentschutz, in denen die Fragen der Glaubwürdigkeit und der Semantik sehr wichtig sind, stellen uns nicht nur vor neue und spannende Herausforderungen, sondern auch vor hohe Belohnungen: Verbesserung des Zugangs zu vertrauenswürdigen medizinischen Informationen für Patienten, Allgemeinmedizinern und Spezialisten, und steigender Innovationsgrad. Es besteht allerdings keine Gefahr, dass Maschinen bald in der Lage sein werden, hoch kognitive Funktionen des menschlichen Verstandes zu ersetzen die notwendige Sammlung von Menschenverstand ist jenseits der Fähigkeiten von Maschinen, trotz der Versprechungen von Big Data.

Forschungsstätte(n)

Technische Universität Wien - 100%

Internationale Projektbeteiligte

Adrian Popescu, Commissariat à l´Energie Atomique (CEA) - Frankreich
Adrian Iftene, University Alexandru-Ioan-Cuza at Iasi - Rumänien
Pinar Duygulu-Sahin, Bilkent University - Türkei

Research Output

184 Zitationen
34 Publikationen

Publikationen

Titel	CLEF eHealth evaluation lab 2015, task 2: Retrieving information about medical symptoms.
Typ	Conference Proceeding Abstract
Autor	Palotti J

Titel	Credibility in Information Retrieval
DOI	10.1561/1500000046
Typ	Journal Article
Autor	Ginsca A
Journal	Foundations and Trends® in Information Retrieval
Seiten	355-475

Titel	On the Use of Statistical Semantics for Metadata-Based Social Image Retrieval
DOI	10.1109/cbmi.2015.7153634
Typ	Conference Proceeding Abstract
Autor	Rekabsaz N
Seiten	1-4
Link	Publikation

Titel	TUW @ MediaEval 2015 Retrieving Diverse Social Images Task.
Typ	Conference Proceeding Abstract
Autor	Hanbury A Et Al
Konferenz	MediaEval 2015.

Titel	Diagnose This If You Can
DOI	10.1007/978-3-319-16354-3_62
Typ	Book Chapter
Autor	Zuccon G
Verlag	Springer Nature
Seiten	562-567

Titel	Retrieving Diverse Social Images at MediaEval 2015: Challenge, Dataset and Evaluation.
Typ	Conference Proceeding Abstract
Autor	Ionescu B
Konferenz	MediaEval 2015.

Titel	On the use of statistical semantics for metadata-based social image retrieval.
Typ	Conference Proceeding Abstract
Autor	Lupu M Et Al
Konferenz	Proc. Content-Based Multimiedia Imaging (CBMI) 2015

Titel	How users search and what they search for in the medical domain
DOI	10.1007/s10791-015-9269-8
Typ	Journal Article
Autor	Palotti J
Journal	Information Retrieval Journal
Seiten	189-224
Link	Publikation

Titel	TUW@ TREC clinical decision support track.
Typ	Conference Proceeding Abstract
Autor	Hanbury A Et Al
Konferenz	Proceedings of the 2014 Text Retrieval Conference.

Titel	Div150Cred: A social image retrieval result diversification with user tagging credibility dataset.
Typ	Conference Proceeding Abstract
Autor	Ionescu B
Konferenz	MMSys 2015

Titel	Div150Cred
DOI	10.1145/2713168.2713192
Typ	Conference Proceeding Abstract
Autor	Ionescu B
Seiten	207-212

Titel	Leveraging Metropolis-Hastings Algorithm on Graph-based Model for Multimodal IR.
Typ	Conference Proceeding Abstract
Autor	Rauber A Et Al
Konferenz	GSB@SIGIR 2015

Titel	Reachability Analysis of Graph Modelled Collections
DOI	10.1007/978-3-319-16354-3_41
Typ	Book Chapter
Autor	Sabetghadam S
Verlag	Springer Nature
Seiten	370-381

Titel	Toward Optimized Multimodal Concept Indexing
DOI	10.1007/978-3-319-27932-9_13
Typ	Book Chapter
Autor	Rekabsaz N
Verlag	Springer Nature
Seiten	141-152

Titel	Evaluating User Image Tagging Credibility
DOI	10.1007/978-3-319-24027-5_4
Typ	Book Chapter
Autor	Ginsca A
Verlag	Springer Nature
Seiten	41-52

Titel	A faceted approach to reachability analysis of graph modelled collections
DOI	10.1007/s13735-017-0145-8
Typ	Journal Article
Autor	Sabetghadam S
Journal	International Journal of Multimedia Information Retrieval
Seiten	157-171
Link	Publikation

Titel	Exploiting health related features to infer user expertise in the medical domain.
Typ	Conference Proceeding Abstract
Autor	Müller H Et Al
Konferenz	Web Search Click Data workshop at WSCM, New York City, NY, USA. 2014.

Titel	A review of users' search contexts for lifelogging system design
DOI	10.1145/2637002.2637040
Typ	Conference Proceeding Abstract
Autor	Liu Y
Seiten	271-274

Titel	Retrieving Diverse Social Images at MediaEval 2014: Challenge, Dataset and Evaluation.
Typ	Conference Proceeding Abstract
Autor	Ionescu B
Konferenz	MediaEval 2014

Titel	A System Framework for Concept- and Credibility-Based Multimedia Retrieval
DOI	10.1145/2578726.2582624
Typ	Conference Proceeding Abstract
Autor	Bierig R
Seiten	543-546
Link	Publikation

Titel	Which One to Choose: Random Walks or Spreading Activation?
DOI	10.1007/978-3-319-12979-2_11
Typ	Book Chapter
Autor	Sabetghadam S
Verlag	Springer Nature
Seiten	112-119

Titel	User intent behind medical queries
DOI	10.1145/2637002.2637043
Typ	Conference Proceeding Abstract
Autor	Palotti J
Seiten	283-286
Link	Publikation

Titel	A Combined Approach of Structured and Non-structured IR in Multimodal Domain
DOI	10.1145/2578726.2578801
Typ	Conference Proceeding Abstract
Autor	Sabetghadam S
Seiten	491-494
Link	Publikation

Titel	Insight to Hyponymy Lexical Relation Extraction in the Patent Genre Versus Other Text Genres.
Typ	Conference Proceeding Abstract
Autor	Anderson L
Konferenz	IPaMin@ KONVENS

Titel	TUW@ Retrieving Diverse Social Images Task 2014.
Typ	Conference Proceeding Abstract
Autor	Hanbury A Et Al
Konferenz	MediaEval. 2014

Titel	Div150Multi: a social image retrieval result diversification dataset with multi-topic queries.
Typ	Conference Proceeding Abstract
Autor	Ionescu B
Konferenz	MMSys 2016

Titel	Building Evaluation Datasets for Consumer-Oriented Information Retrieval.
Typ	Conference Proceeding Abstract
Autor	Goeuriot L
Konferenz	Proc. of Language Resources and Evaluation Conference (LREC) 2016

Titel	TUW@ TREC Clinical Decision Support Track 2015.
Typ	Conference Proceeding Abstract
Autor	Hanbury A
Konferenz	Proceedings of the 2015 Text Retrieval Conference.

Titel	Dataset: Div150Multi: A Social Image Retrieval Result Diversification Dataset with Multi-topic Queries (2016).
Typ	Other

Titel	Open Source Software: MUCKE Information Retrieval Evaluation System (2016).
Typ	Other

Titel	Dataset: Div400: A Social Image Retrieval Result Diversification Dataset (2014).
Typ	Other

DOI	10.1145/2578726
Typ	Other

DOI	10.1145/2637002
Typ	Other

Titel	Dataset: Div150Cred: A Social Image Retrieval Result Diversification with User Tagging Credibility Dataset (2015).
Typ	Other

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

Multimedia und Benutzerglaubwürdigkeit Wissensextraktion

Multimedia and User Credibility Knowledge Extraction

Wissenschaftsdisziplinen

Keywords

Research Output

Kontakt

Allgemeines

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

SOCIAL MEDIA

SCILOG

Multimedia und Benutzerglaubwürdigkeit Wissensextraktion

Multimedia and User Credibility Knowledge Extraction

Wissenschaftsdisziplinen

Keywords

Research Output