Trainierbare Aggregationsfunktionen
Trainable Feature Aggregation
Wissenschaftsdisziplinen
Informatik (100%)
Keywords
-
Trainable Feature Aggregation,
Recurrent neural networks,
Image Processing,
Pattern Recognition
In vielen Anwendungen der Bildverarbeitung werden `Objekte` aus dem Bild extrahiert und durch Merkmalsvektoren repräsentiert. Häufig ist es dann notwendig, im Rahmen einer Klassifikationsaufgabe die Menge an Objekten als Ganzes zu klassifizieren. Dazu wird meist eine Aggregationsfunktion und ein Klassifikator genutzt, der die aggregierten Merkmale als Eingang verwendet. Für eine solche Kombination aus Aggregation und Klassifikation sind folgende Eigenschaften wünschenswert: (1) Das Verfahren muß mit einer variierenden Anzahl an Objekten (Merkmalsvektoren) umgehen können, da deren Anzahl von Bild zu Bild unterschiedlich ist. (2) Die Aggregation muß Zusammenhänge modellieren können, die deutlich komplexer sind als Summen, Mittelwerte oder einfache logische Kombinationen einzelner Klassifikationsergebnisse. (3) Das Klassifikationsergebnis muß unabhängig von der Reihenfolge sein, in der die Merkmals- vektoren aggregiert werden. (4) Das kombinierte Aggregations-/Klassifikationsverfahren muß an Daten trainierbar sein. Derzeit existieren keine mathematischen Strukturen, die alle diese Eigenschaften in hohem Maß erfüllen. Im besonderen sind trainierbare Aggregationsfunktionen nicht sehr intensiv untersucht. Ziel des Projektes ist es daher, ein kombiniertes Aggregations-/Klassifikationsverfahren zu entwickeln, das alle Eigenschaften (1)-(4) sehr gut erfüllt. Zu diesem Zweck werden wir rückgekoppelte neuronale Netze einsetzen. Deren rekursive Struktur ermöglicht es, mit einer variierenden Anzahl an Merkmalsvektoren umzugehen; die Netze sind trainierbar und hinreichend flexibel, um auch komplexe Zusammenhänge zu erlernen. Die Forschungsarbeiten konzentrieren sich daher auf den Zusammenhang zwischen der Struktur des Netzwerks und der Komplexität der erlernbaren Aggregationsfunktionen, die Frage der Reihenfolge-Invarianz, und auf Lernverfahren für die entwickelten Strukturen. Für jedes dieser Themen werden mehrere alternative Ansätze untersucht und evaluiert, sodaß am Ende ein neuronales Netz zur Verfügung steht, das alle erforderlichen Eigenschaften besitzt.
In vielen Anwendungen der Bildverarbeitung werden `Objekte` aus dem Bild extrahiert und durch Merkmalsvektoren repräsentiert. Häufig ist es dann notwendig, im Rahmen einer Klassifikationsaufgabe die Menge an Objekten als Ganzes zu klassifizieren. Dazu wird meist eine Aggregationsfunktion und ein Klassifikator genutzt, der die aggregierten Merkmale als Eingang verwendet. Für eine solche Kombination aus Aggregation und Klassifikation sind folgende Eigenschaften wünschenswert: 1. Das Verfahren muß mit einer variierenden Anzahl an Objekten (Merkmalsvektoren) umgehen können, da deren Anzahl von Bild zu Bild unterschiedlich ist. 2. Die Aggregation muß Zusammenhänge modellieren können, die deutlich komplexer sind als Summen, Mittelwerte oder einfache logische Kombinationen einzelner Klassifikationsergebnisse. 3. Das Klassifikationsergebnis muß unabhängig von der Reihenfolge sein, in der die Merkmals- vektoren aggregiert werden. 4. Das kombinierte Aggregations-/Klassifikationsverfahren muß an Daten trainierbar sein. Derzeit existieren keine mathematischen Strukturen, die alle diese Eigenschaften in hohem Maß erfüllen. Im besonderen sind trainierbare Aggregationsfunktionen nicht sehr intensiv untersucht. Ziel des Projektes ist es daher, ein kombiniertes Aggregations-/Klassifikationsverfahren zu entwickeln, das alle Eigenschaften (1)-(4) sehr gut erfüllt. Zu diesem Zweck werden wir rückgekoppelte neuronale Netze einsetzen. Deren rekursive Struktur ermöglicht es, mit einer variierenden Anzahl an Merkmalsvektoren umzugehen; die Netze sind trainierbar und hinreichend flexibel, um auch komplexe Zusammenhänge zu erlernen. Die Forschungsarbeiten konzentrieren sich daher auf den Zusammenhang zwischen der Struktur des Netzwerks und der Komplexität der erlernbaren Aggregationsfunktionen, die Frage der Reihenfolge-Invarianz, und auf Lernverfahren für die entwickelten Strukturen. Für jedes dieser Themen werden mehrere alternative Ansätze untersucht und evaluiert, sodaß am Ende ein neuronales Netz zur Verfügung steht, das alle erforderlichen Eigenschaften besitzt.
- Technische Universität Wien - 50%
- Profactor GmbH (VPTÖ) - 50%
- Christian Eitzinger, Profactor GmbH (VPTÖ) , assoziierte:r Forschungspartner:in
Research Output
- 1 Publikationen
-
2025
Titel Comparative analysis of rainfall event characteristics and rainfall erosivity between two experimental plots in Austria and Slovenia DOI 10.1016/j.ejrh.2025.102353 Typ Journal Article Autor Szeles B Journal Journal of Hydrology: Regional Studies Seiten 102353 Link Publikation