Projektdetail

Grant-DOI 10.55776/J3335
Bewilligungssumme Erwin Schrödinger
Status beendet
Projektbeginn 01.10.2012
Projektende 31.05.2015
Bewilligungssumme 119.840 €

Wissenschaftsdisziplinen

Elektrotechnik, Elektronik, Informationstechnik (30%); Informatik (30%); Mathematik (40%)

Keywords

Dictionary Learning,
Sparse Coding,
Structured Sparsity,
Biometric Data,
Dimensionality Reduction

Abstract

Zusammenfassung

Forschung in den letzten Jahren hat gezeigt, dass viele Probleme der hochdimensionalen Datenverarbeitung, wie Kompression oder Rauschunterdrückung, effizient gelöst werden können, wenn die vorliegenden Signale eine spärliche Darstellung in einem bekannten Erzeugendensystem, genannt Wörterbuch, haben. Dies führt zu der grundsätzlichen Frage, wie Wörterbücher, die spärliche Darstellungen für eine gegebene Datenklasse ermöglichen, gefunden werden können -ein Problem bekannt unter den Begriffen Wörterbuch Lernen oder spärliche Codierung. Das Ziel dieses Projektes ist es, Wörterbuch Lernen für biometrische Daten zu studieren. Der Schwerpunkt im Bereich des Wörterbuch Lernens bisher lag auf der Entwicklung von Lernalgorithmen, die jedoch alle an einer der folgenden Einschränkungen leiden. Es gibt keine Charakterisierung des Ergebnisses eines Algorithmus, also keinen Hinweis darauf, ob er angemessen für die vorliegenden Daten ist. Der Algorithmus ist zu komplex, um für sehr hochdimensionale Daten verwendbar zu sein. Der Algorithmus basiert auf der Annahme, dass alle Elemente des Wörterbuchs mit der gleichen Wahrscheinlichkeit und Stärke verwendet werden. Beim Umgang mit biometrischen Daten verhindern vor allem die letzten zwei Einschränkungen die Verwendung von bereits vorhandenen Algorithmen, da biometrische Daten, wie etwa ganze Irisbilder, in der Regel eine hohe Dimension aufweisen und sehr strukturiert sind. Gesichtsbilder, zum Beispiel, weisen auf einer groben Ebene starke Ähnlichkeiten zwischen einander auf, was die bevorzugte Verwendung von einem Wörterbuchelement in allen Darstellungen nahe legt. Das Projekt beabsichtigt, die oben genannten Einschränkungen von Wörterbuchlernalgorithmen zu überwinden und dabei folgendermaßen vorzugehen. Zuerst werden geeignete Modelle strukturierter Spärlichkeit für drei Klassen biometrischen Daten untersucht und, darauf basierend, werden einfache Algorithmen entwickelt, die nachweislich von Datenklassen, die diesen Modellen folgen, das zugrunde liegende Wörterbuch identifizieren. Um den Rechenaufwand der Algorithmen niedrigen zu halten, werden Maßnahmen zur Dimensionsreduktion untersucht. Schließlich wird das Projekt eine Verbindung herstellen zwischen dem Lernen von Wörterbüchern, die für einer Aufgabe, wie Klassifizierung, geeignet sind, und dem Lernen von Wörterbuchern für strukturierte Spärlichkeit.

Dictionary Learning ist ein Technik um anhand von einigen Elementen einer Datenklasse, wie etwa Bilder oder Sprachsignale, Bausteine (dictionary) zu lernen, die es erlauben alle Elemente der Datenklasse effizient darzustellen. Genauer gesagt besteht diese Darstellung aus der Summe einer kleinen Zahl adaptiv gewählter und skalierter Bausteine. Die Tatsache, dass eine solche Darstellung existiert ist für viele Aufgaben in der Signalverarbeitung extrem hilfreich, zum Beispiel Entrauschen von Bildern oder Rekonstruktion von fehlenden Dateneinträgen.Ein praktisches Beispiel ist die Magnetresonanztomographie, wo basierend auf den geeigneten Bausteinen die Anzahl der Messungen und damit die Messzeit im Gerät verringert werden kann. Das Problem der meisten Lernalgorithmen ist, dass sie sehr rechenintensiv sind und dass keine Garantien existieren, dass der Algorithmus das richtige Ergebnis liefert. In diesem Projekt konnten wir Aufschluss geben, wann K-SVD, der Ferrari unter den dictionary learning Algorithmen, gut funktioniert. Ausgehend von den Schwächen von K-SVD in einigen Bereichen, die durch die theoretischen Ergebnisse zu Tage kamen, entwickelten wir zwei sehr einfache iterative Lernalgorithmen, die abwechselnd Schwellenwerte finden und geeignet Mittelwerte der dazu gehörenden Signale (ITKsM) oder Signalreste (ITKrM) berechnen. Für beide Algorithmen konnten wir gute lokale Eigenschaften beweisen und im Fall von ITKrM experimentell auch gute globale Eigenschaften zeigen. Der Hauptvorteil von ITKrM gegenüber K-SVD ist, dass er wesentlich weniger rechenintensiv und daher schneller ist. Außerdem können die Trainingssignale nacheinander verarbeitet werden, bzw. kann die Rechenarbeit auf mehrere Computer verteilt werden, was die Rechengeschwindigkeit weiter erhöht. Diese Recheneffizienz macht ITKrM zum Fiat 500 unter den Lernalgorithmen und bewirkt, dass dictionary learning auf einen breiteren Bereich von Problemgrößen angewendet werden kann. Zurückkommend auf das Beispiel der Magnetresonanztomographie kann dies zu einer weiteren Verringerung der Messzeit beitragen.

Forschungsstätte: Auslandsphase

Universitá degli Studi di Sassari , 24 Monate, Massimo Tistarelli

Forschungsstätte: Rückkehrphase

Universität Innsbruck , 8 Monate

Research Output

75 Zitationen
8 Publikationen
1 Wissenschaftliche Auszeichnungen

Publikationen

Titel	Local Identification of Overcomplete Dictionaries
DOI	10.48550/arxiv.1401.6354
Typ	Preprint
Autor	Schnass K

Titel	On the identifiability of overcomplete dictionaries via the minimisation principle underlying K-SVD
DOI	10.1016/j.acha.2014.01.005
Typ	Journal Article
Autor	Schnass K
Journal	Applied and Computational Harmonic Analysis
Seiten	464-491
Link	Publikation

Titel	Convergence radius and sample complexity of ITKM algorithms for dictionary learning
DOI	10.48550/arxiv.1503.07027
Typ	Preprint
Autor	Schnass K

Titel	A Personal Introduction to Theoretical Dictionary Learning.
Typ	Journal Article
Autor	Schnass K
Journal	Internationale Mathematische Nachrichten (Bulletin Austrian Mathematical Society)

Titel	Local Identification of Overcomplete Dictionaries
Typ	Journal Article
Autor	Schnass Karin
Journal	JOURNAL OF MACHINE LEARNING RESEARCH
Seiten	1211-1242

Titel	Convergence radius and sample complexity of ITKM algorithms for dictionary learning
DOI	10.1016/j.acha.2016.08.002
Typ	Journal Article
Autor	Schnass K
Journal	Applied and Computational Harmonic Analysis
Seiten	22-58
Link	Publikation

Titel	On the Identifiability of Overcomplete Dictionaries via the Minimisation Principle Underlying K-SVD
DOI	10.48550/arxiv.1301.3375
Typ	Preprint
Autor	Schnass K

Titel	Dictionary identification results for K-SVD with sparsity parameter 1.
Typ	Conference Proceeding Abstract
Autor	Schnass K
Konferenz	Proceedings SampTA13, Bremen, DE, 2013

Wissenschaftliche Auszeichnungen

Titel	Oberwolfach 2015 - invited talk
Typ	Personally asked as a key note speaker to a conference
Bekanntheitsgrad	Continental/International

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

Lernen von Erzeugendensystemen für biometrische Daten

Dictionary Learning for Biometric Data

Wissenschaftsdisziplinen

Keywords

Research Output

Kontakt

Allgemeines

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

SOCIAL MEDIA

SCILOG

Lernen von Erzeugendensystemen für biometrische Daten

Dictionary Learning for Biometric Data

Wissenschaftsdisziplinen

Keywords

Research Output