Tracking mit Struktur im Machinellessehen
Tracking with Structure in Computer Vision (TWIST-CV)
Wissenschaftsdisziplinen
Informatik (100%)
Keywords
-
Computer Vision,
Surveillance,
Tracking,
Graph Pyramids,
Combinatorial Maps,
Structural Pattern Recognition
Das Verfolgen (Tracking) von Objekten in Bildsequenzen ist im maschinellen Sehen sehr wichtig. Tracking Verfahren sind z.B. unentbehrlich für die automatische Verfolgung von Personen, die durch Überwachungskameras gefilmt werden oder für das Folgen der Position eines Kopfes und der Hände in einer Mensch-Maschine- Schnittstelle. Eine interessante Erweiterung soll die 3D Informationen, die von zwei oder mehr Kameras eingeholt werden, verwenden, um das Tracking zu unterstützen. Es gibt viele Methoden, um das Problem der Objektverfolgung zu lösen. Obgleich diese Methoden erfolgreich sind, ist es häufig der Fall, dass sie nicht robust genug sind oder dass unterschiedliche Methoden für unterschiedliche Anwendungen verwendet werden müssen. Neueste, von einem der Projektpartner (PRIP) durchgeführte, Untersuchungen haben gezeigt, dass die Verwendung von Matching von Graphenpyramiden und von kombinatorischen Kartenpyramiden einer guter Ansatz ist, um Probleme im maschinellen Sehen zu lösen. Vielversprechende Ausgangsergebnisse konnten die Anwendung dieser Methodologie im Bereich des Objektverfolgens erreicht werden. Das Hauptziel des vorgeschlagenen Projektes ist es, ein allgemeines Rahmenwerk zu entwickeln, das die Lösung von praktischen Problemen des maschinellen Sehens mit Hilfe von Methoden, die Bildstruktur verwenden, ermöglicht. Das Projekt verwendet strukturelle Methoden wie auf Graphen und kombinatorische Karten basierende Bildrepräsentationen, Graphen- und kombinatorische Kartenpyramiden und Matching, um eine Lösung zu den folgenden Aufgaben innerhalb eines einzelnen Rahmenwerks zu versuchen: 1. Finden der Objektkorrespondenzen in Bildsequenzen (Verfolgung). 2. Finden der Objektkorrespondenzen in Bildern, die von unterschiedlichen Aussichtspunkten aufgenommen sind (Stereo Matching). 3. Finden der Objektkorrespondenzen in Bildsequenzen, die von unterschiedlichen Aussichtspunkten aufgenommen sind (eine Kombination der oben genannten zwei Methoden). Die Verwendung dieses angedachten Rahmenwerks würde die Lösungen vieler praktischer Probleme vereinfachen. Um die entwickelten Algorithmen und das Rahmenwerk richtig auszuwerten, beabsichtigen wir sie mit vorhandenen Algorithmen rigoros zu vergleichen. Zu diesem Zweck, verwenden wir bestehende Benchmarking- Datenbanken und Daten aus Anwendungen im Bereich der Überwachung und der Mensch-Maschine-Schnittstellen, die vom zweiten Projektpartner (ACV) in Industrieforschungsprojekten erforscht werden.
Das Verfolgen (Tracking) von Objekten in Bildsequenzen ist im maschinellen Sehen sehr wichtig. Tracking Verfahren sind z.B. unentbehrlich für die automatische Verfolgung von Personen, die durch Überwachungskameras gefilmt werden oder für das Folgen der Position eines Kopfes und der Hände in einer Mensch-Maschine- Schnittstelle. Eine interessante Erweiterung soll die 3D Informationen, die von zwei oder mehr Kameras eingeholt werden, verwenden, um das Tracking zu unterstützen. Es gibt viele Methoden, um das Problem der Objektverfolgung zu lösen. Obgleich diese Methoden erfolgreich sind, ist es häufig der Fall, dass sie nicht robust genug sind oder dass unterschiedliche Methoden für unterschiedliche Anwendungen verwendet werden müssen. Neueste, von einem der Projektpartner (PRIP) durchgeführte, Untersuchungen haben gezeigt, dass die Verwendung von Matching von Graphenpyramiden und von kombinatorischen Kartenpyramiden einer guter Ansatz ist, um Probleme im maschinellen Sehen zu lösen. Vielversprechende Ausgangsergebnisse konnten die Anwendung dieser Methodologie im Bereich des Objektverfolgens erreicht werden. Das Hauptziel des vorgeschlagenen Projektes ist es, ein allgemeines Rahmenwerk zu entwickeln, das die Lösung von praktischen Problemen des maschinellen Sehens mit Hilfe von Methoden, die Bildstruktur verwenden, ermöglicht. Das Projekt verwendet strukturelle Methoden wie auf Graphen und kombinatorische Karten basierende Bildrepräsentationen, Graphen- und kombinatorische Kartenpyramiden und Matching, um eine Lösung zu den folgenden Aufgaben innerhalb eines einzelnen Rahmenwerks zu versuchen: 1. Finden der Objektkorrespondenzen in Bildsequenzen (Verfolgung). 2. Finden der Objektkorrespondenzen in Bildern, die von unterschiedlichen Aussichtspunkten aufgenommen sind (Stereo Matching). 3. Finden der Objektkorrespondenzen in Bildsequenzen, die von unterschiedlichen Aussichtspunkten aufgenommen sind (eine Kombination der oben genannten zwei Methoden). Die Verwendung dieses angedachten Rahmenwerks würde die Lösungen vieler praktischer Probleme vereinfachen. Um die entwickelten Algorithmen und das Rahmenwerk richtig auszuwerten, beabsichtigen wir sie mit vorhandenen Algorithmen rigoros zu vergleichen. Zu diesem Zweck, verwenden wir bestehende Benchmarking- Datenbanken und Daten aus Anwendungen im Bereich der Überwachung und der Mensch-Maschine-Schnittstellen, die vom zweiten Projektpartner (ACV) in Industrieforschungsprojekten erforscht werden.
- Advanced Computer Vision GmbH - 50%
- Technische Universität Wien - 50%
- Markus Clabian, Austrian Institute of Technology - AIT , assoziierte:r Forschungspartner:in
- Luc Brun, Ecole Nationale Superieure d Ingenieurs de Caen - Frankreich
- Pascal Lienhardt, Université de Poitiers - Frankreich
Research Output
- 94 Zitationen
- 9 Publikationen
-
2011
Titel Hierarchical spatio-temporal extraction of models for moving rigid parts DOI 10.1016/j.patrec.2011.05.005 Typ Journal Article Autor Artner N Journal Pattern Recognition Letters Seiten 2239-2249 Link Publikation -
2011
Titel Multi-scale 2D tracking of articulated objects using hierarchical spring systems DOI 10.1016/j.patcog.2010.10.025 Typ Journal Article Autor Artner N Journal Pattern Recognition Seiten 800-810 Link Publikation -
2011
Titel Reprint of: Multi-scale 2D tracking of articulated objects using hierarchical spring systems DOI 10.1016/j.patcog.2011.04.004 Typ Journal Article Autor Artner N Journal Pattern Recognition Seiten 1969-1979 -
2011
Titel Invariant representative cocycles of cohomology generators using irregular graph pyramids DOI 10.1016/j.cviu.2010.12.009 Typ Journal Article Autor Gonzalez-Diaz R Journal Computer Vision and Image Understanding Seiten 1011-1022 Link Publikation -
2008
Titel 3D Shape Matching by Geodesic Eccentricity*Partially supported by the Austrian Science Fund under grants S9103-N13 and P18716-N13. DOI 10.1109/cvprw.2008.4563032 Typ Conference Proceeding Abstract Autor Ion A Seiten 1-8 Link Publikation -
2008
Titel A Coordinate System for Articulated 2D Shape Point Correspondences* DOI 10.1109/icpr.2008.4761495 Typ Conference Proceeding Abstract Autor Ion A Seiten 1-4 -
2011
Titel Matching 2D and 3D articulated shapes using the eccentricity transform DOI 10.1016/j.cviu.2011.02.006 Typ Journal Article Autor Ion A Journal Computer Vision and Image Understanding Seiten 817-834 Link Publikation -
2006
Titel Evaluating Hierarchical Graph-Based Segmentation DOI 10.1109/icpr.2006.511 Typ Conference Proceeding Abstract Autor Haxhimusa Y Seiten 195-198 -
2006
Titel Distinguishing 3D-Topological Configurations of Two Tori**This paper was supported by the Austrian Science Fund under grants S9103-N04 and FWF-P18716-N13. DOI 10.1109/synasc.2006.30 Typ Conference Proceeding Abstract Autor Ion A Seiten 111-118