Lernen von Erzeugendensystemen für biometrische Daten
Dictionary Learning for Biometric Data
Wissenschaftsdisziplinen
Elektrotechnik, Elektronik, Informationstechnik (30%); Informatik (30%); Mathematik (40%)
Keywords
-
Dictionary Learning,
Sparse Coding,
Structured Sparsity,
Biometric Data,
Dimensionality Reduction
Forschung in den letzten Jahren hat gezeigt, dass viele Probleme der hochdimensionalen Datenverarbeitung, wie Kompression oder Rauschunterdrückung, effizient gelöst werden können, wenn die vorliegenden Signale eine spärliche Darstellung in einem bekannten Erzeugendensystem, genannt Wörterbuch, haben. Dies führt zu der grundsätzlichen Frage, wie Wörterbücher, die spärliche Darstellungen für eine gegebene Datenklasse ermöglichen, gefunden werden können -ein Problem bekannt unter den Begriffen Wörterbuch Lernen oder spärliche Codierung. Das Ziel dieses Projektes ist es, Wörterbuch Lernen für biometrische Daten zu studieren. Der Schwerpunkt im Bereich des Wörterbuch Lernens bisher lag auf der Entwicklung von Lernalgorithmen, die jedoch alle an einer der folgenden Einschränkungen leiden. Es gibt keine Charakterisierung des Ergebnisses eines Algorithmus, also keinen Hinweis darauf, ob er angemessen für die vorliegenden Daten ist. Der Algorithmus ist zu komplex, um für sehr hochdimensionale Daten verwendbar zu sein. Der Algorithmus basiert auf der Annahme, dass alle Elemente des Wörterbuchs mit der gleichen Wahrscheinlichkeit und Stärke verwendet werden. Beim Umgang mit biometrischen Daten verhindern vor allem die letzten zwei Einschränkungen die Verwendung von bereits vorhandenen Algorithmen, da biometrische Daten, wie etwa ganze Irisbilder, in der Regel eine hohe Dimension aufweisen und sehr strukturiert sind. Gesichtsbilder, zum Beispiel, weisen auf einer groben Ebene starke Ähnlichkeiten zwischen einander auf, was die bevorzugte Verwendung von einem Wörterbuchelement in allen Darstellungen nahe legt. Das Projekt beabsichtigt, die oben genannten Einschränkungen von Wörterbuchlernalgorithmen zu überwinden und dabei folgendermaßen vorzugehen. Zuerst werden geeignete Modelle strukturierter Spärlichkeit für drei Klassen biometrischen Daten untersucht und, darauf basierend, werden einfache Algorithmen entwickelt, die nachweislich von Datenklassen, die diesen Modellen folgen, das zugrunde liegende Wörterbuch identifizieren. Um den Rechenaufwand der Algorithmen niedrigen zu halten, werden Maßnahmen zur Dimensionsreduktion untersucht. Schließlich wird das Projekt eine Verbindung herstellen zwischen dem Lernen von Wörterbüchern, die für einer Aufgabe, wie Klassifizierung, geeignet sind, und dem Lernen von Wörterbuchern für strukturierte Spärlichkeit.
Dictionary Learning ist ein Technik um anhand von einigen Elementen einer Datenklasse, wie etwa Bilder oder Sprachsignale, Bausteine (dictionary) zu lernen, die es erlauben alle Elemente der Datenklasse effizient darzustellen. Genauer gesagt besteht diese Darstellung aus der Summe einer kleinen Zahl adaptiv gewählter und skalierter Bausteine. Die Tatsache, dass eine solche Darstellung existiert ist für viele Aufgaben in der Signalverarbeitung extrem hilfreich, zum Beispiel Entrauschen von Bildern oder Rekonstruktion von fehlenden Dateneinträgen.Ein praktisches Beispiel ist die Magnetresonanztomographie, wo basierend auf den geeigneten Bausteinen die Anzahl der Messungen und damit die Messzeit im Gerät verringert werden kann. Das Problem der meisten Lernalgorithmen ist, dass sie sehr rechenintensiv sind und dass keine Garantien existieren, dass der Algorithmus das richtige Ergebnis liefert. In diesem Projekt konnten wir Aufschluss geben, wann K-SVD, der Ferrari unter den dictionary learning Algorithmen, gut funktioniert. Ausgehend von den Schwächen von K-SVD in einigen Bereichen, die durch die theoretischen Ergebnisse zu Tage kamen, entwickelten wir zwei sehr einfache iterative Lernalgorithmen, die abwechselnd Schwellenwerte finden und geeignet Mittelwerte der dazu gehörenden Signale (ITKsM) oder Signalreste (ITKrM) berechnen. Für beide Algorithmen konnten wir gute lokale Eigenschaften beweisen und im Fall von ITKrM experimentell auch gute globale Eigenschaften zeigen. Der Hauptvorteil von ITKrM gegenüber K-SVD ist, dass er wesentlich weniger rechenintensiv und daher schneller ist. Außerdem können die Trainingssignale nacheinander verarbeitet werden, bzw. kann die Rechenarbeit auf mehrere Computer verteilt werden, was die Rechengeschwindigkeit weiter erhöht. Diese Recheneffizienz macht ITKrM zum Fiat 500 unter den Lernalgorithmen und bewirkt, dass dictionary learning auf einen breiteren Bereich von Problemgrößen angewendet werden kann. Zurückkommend auf das Beispiel der Magnetresonanztomographie kann dies zu einer weiteren Verringerung der Messzeit beitragen.
Research Output
- 75 Zitationen
- 8 Publikationen
- 1 Wissenschaftliche Auszeichnungen
-
2015
Titel A Personal Introduction to Theoretical Dictionary Learning. Typ Journal Article Autor Schnass K Journal Internationale Mathematische Nachrichten (Bulletin Austrian Mathematical Society) -
2015
Titel Convergence radius and sample complexity of ITKM algorithms for dictionary learning DOI 10.48550/arxiv.1503.07027 Typ Preprint Autor Schnass K -
2015
Titel Local Identification of Overcomplete Dictionaries Typ Journal Article Autor Schnass Karin Journal JOURNAL OF MACHINE LEARNING RESEARCH Seiten 1211-1242 -
2013
Titel On the Identifiability of Overcomplete Dictionaries via the Minimisation Principle Underlying K-SVD DOI 10.48550/arxiv.1301.3375 Typ Preprint Autor Schnass K -
2014
Titel On the identifiability of overcomplete dictionaries via the minimisation principle underlying K-SVD DOI 10.1016/j.acha.2014.01.005 Typ Journal Article Autor Schnass K Journal Applied and Computational Harmonic Analysis Seiten 464-491 Link Publikation -
2014
Titel Local Identification of Overcomplete Dictionaries DOI 10.48550/arxiv.1401.6354 Typ Preprint Autor Schnass K -
2013
Titel Dictionary identification results for K-SVD with sparsity parameter 1. Typ Conference Proceeding Abstract Autor Schnass K Konferenz Proceedings SampTA13, Bremen, DE, 2013 -
2018
Titel Convergence radius and sample complexity of ITKM algorithms for dictionary learning DOI 10.1016/j.acha.2016.08.002 Typ Journal Article Autor Schnass K Journal Applied and Computational Harmonic Analysis Seiten 22-58 Link Publikation
-
2015
Titel Oberwolfach 2015 - invited talk Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International