Ähnlichkeitssuche für Musik mit neuen Kombinationen von symbolischen und Audio-Methoden
Combining Audio and Symbolic Approaches for Music Similarity Search
Wissenschaftsdisziplinen
Elektrotechnik, Elektronik, Informationstechnik (20%); Informatik (50%); Kunstwissenschaften (25%); Psychologie (5%)
Keywords
-
Music Information Retrieval,
Content-based searching,
Melodic similarity,
Audio feature extraction,
Indexing,
Nearest-neighbour searches
Musiksammlungen nach Vorkommen einer gegebenen Melodie oder nach musikalisch ähnlichem Material durchsuchen zu können, kann für viele Anwendungen nützlich sein. Einige Beispiele sind das Auffinden von Noten oder Aufnahmen in Bibliotheken, Musikläden oder persönlichen Musiksammlungen, musiktheoretische Forschung über die Verbreitung und Entwicklung von Melodien, Autorattribution für anonyme Werke und Dispute über Plagiate. Die Themen dieses Projekts gehören zum Gebiet "Music Information Retrieval". Es gibt drei wesentliche Ziele: die Untersuchung neuer Kombinationen von Ansätzen für inhaltsbasierte Musiksuche für Musiknotation und Audiodaten, Fortschritte auf dem Bereich symbolbasierter Musiksuche, und Verbesserungen der sogenannten "Vantage Indexing"-Methode zur Beschleunigung von Suchalgorithmen. Als Teil meiner Dissertation habe ich einen Suchalgorithmus für Musiksuche auf der symbolischen Ebene entwickelt (MIDI-Dateien oder Partituren). Es wurde gezeigt, dass dieser Algorithmus zu den führenden Methoden gehört.2 Er kann aber nicht direkt auf Audiodaten angewandt werden, weil das Problem der automatischen Konvertierung polyphoner Aufnahmen in Partituren auf absehbare Zeit ungelöst bleiben wird. Um den symbolischen Algorithmus dennoch auf Audiodaten anzuwenden, kann man ihn aber beispielsweise mit Ergebnissen zur Schlagerkennung kombinieren, die von Simon Dixon an der einladenden Institution, dem Österreichischen Forschungsinstitut für Artificial Intelligence (OFAI), erarbeitet wurden. Um meinen Algorithmus für Audio-Melodiesuche anwenden zu können, muss eine neue Methode für das Extrahieren von Melodien aus Audiodaten entwickelt werden. Mein symbolischer Algorithmus selbst kann noch deutlich verbessert werden. Ich werde die Effekte einer besseren Aufsplittung in Stimmen quantifizieren, z. B. indem ich den Algorithmus mit einem Stimmenerkennungs- Algorithmus von Madsen und Widmer (OFAI) oder einem anderen von Kilian und Hoos kombiniere. Außerdem werde ich untersuchen, wie die Suche auf relevantes musikalisches Material eingegrenzt werden kann, z. B. auf melodische Linien, aber nicht Begleitfiguren. Mit "Vantage Indexing" kann inhaltbasierte Suche beschleunigt werden. Die einzige Voraussetzung ist, dass das zugrundeliegende Abstandsmaß die Dreiecksungleichung erfüllt. Diese Methode ist nicht nur für Musiksuche nützlich, sondern auch für andere Probleme wie z. B. die Suche nach Bildern oder in Videos. Es ist aber noch nicht viel darüber bekannt, wie man gute Vantage-Objekte wählen oder konstruieren kann, oder ob man mit Kombinationen mehrerer Vantage-Indizes diese Indexierungsmethode auch dann sinnvoll einsetzen kann, wenn das Abstandsmaß nur eine abgeschwächte Version der Dreiecksungleichung erfüllt oder wenn es die Dreiecksungleichung nur mit einer gewissen Wahrscheinlichkeit erfüllt. Ich werde diese beiden Punkte untersuchen. Insgesamt wird dieses Projekt zu neuen Methoden für die Audio-Musiksuche, einem verbesserten Algorithmus für das Suchen auf der symbolischen Ebene, und zu neuen Einsichten über eine allgemein nützliche Indexierungsmethode führen. 2 Siehe: Ergebnisse für "Symbolic Melodic Similarity" von MIREX 2006, http://rainer.typke.org/mirex06.0.html
- Gerhard Widmer, Universität Linz , assoziierte:r Forschungspartner:in