Maschinelles Lernen für Detektion und Verfolgung
Advanced Learning for Tracking and Detection
DACH: Österreich - Deutschland - Schweiz
Wissenschaftsdisziplinen
Informatik (100%)
Keywords
-
Computer Vision,
Person Detection,
Visual Tracking,
On-line Learning,
Medical Workflow Analysis
Das primäre Ziel dieses Projektes ist es den "state of the art" von Objektdetektions- und Objektverfolgungs- Methoden signifikant zu verbessern. Dies wird möglich in dem die komplementäre Expertise von drei in Europa führenden Computer Vision Labs kombiniert wird. Die medizinische Workflow-Analyse dient primär als Testszenario um (i) neue Herausforderungen für Detektion und Verfolgung zu haben sowie (ii) um die neuen Algorithmen an komplexen Aufgaben testen zu können. Das Wissen um Handlungen und Handlungsabläufe in einem Operationssaal ist für eine Reihe von Anwendungen höchst relevant. Das Ziel in diesem Projekt ist es die Handlungen von Personen sowie großee Objekte mittels eines Multi-Kamerasystems zu erfassen, und diese dann als Eingabe an ein Workflow-Analysesystem zu übergeben. Aus algorithmischer Sicht liegt der Fokus des Projektes auf neuen Detektions und Tracking Methoden. Die notwendige Robustheit und Adaptivität soll durch neue on-line Lernverfahren erreicht werden. Unsupervised und Semi-supervised Lernen ist ein weiterer Forschungsfokus in dem Projekt. Lernen ist integraler Bestandteil der Detektion und der Trackingverfahren. Durch die starke Integration der Lernkomponente wird einerseits ein effizienteres Lernen durch bessere Daten als auch ein besseres Tracking und eine genauere Detektion durch szenenspezifische Modelle ermöglicht. Das Ergebnis der Detektion und der Objektverfolgung wird zur Analyse von Verhaltensmustern eingesetzt die wiederum Eingang in die medizinische Workflow-Analyse finden.
Dieser Projektteil des DACH Projektes hat sich mit maschinellen Lernmethoden beschäftigt, um Objektdetektions- und Objektverfolgungsmethoden zu verbessern. Als primäres Testszenario wurde die medizinische Workflow-Analyse gewählt, um einerseits neue Herausforderungen für Detektion und Verfolgung (Tracking) aufzuzeigen und andererseits die neuen Algorithmen mit komplexen Aufnahmen testen zu können. Das Ziel in diesem Projekt war, die Bewegungen und Handlungen von Personen in einem Operationssaal mittels eines Multi-Kamerasystems zu erfassen und diese dann als Eingabe an ein Workflow-Analysesystem zu übergeben. Der Forschungsschwerpunkt lag dabei auf neuen Detektions- und Tracking-methoden, da diese die wichtigsten Vorverarbeitungsschritte eines vollautomatisierten Analysesystems sind. Die Forschungsarbeit führte zu mehreren Verbesserungen bestehender Detektionsmethoden. So konnten wir durch eine effiziente Gewichtung der Parameter im Hough Forest Framework die Detektionsrate bei verdeckten Objekten signifikant erhöhen. Um auch in schwierigen Situationen (z.B. verursacht durch Beleuchtungsänderungen, Schattenwürfe, oder starke Verdeckungen) robuste Ergebnisse liefern zu können, wurden neue online Lernverfahren eingesetzt, welche die instanz-spezifische Adaptierung des Detektors ermöglichen. Durch eine detaillierte Untersuchung der zugrunde liegenden Lernverfahren konnte zusätzlich die benötigte Inferenzzeit deutlich reduziert werden. Des Weiteren konnten wir eine neue Trainingsmethode für das weit verbreitete Random Forest Framework aufzeigen, welche die Vorteile bestehender Trainingsmethoden um jene des Boosting-verfahrens erweitert. Die verbesserten Detektionsalgorithmen stellen eine wichtige Unterstützung der Trackingalgorithmen dar. Um auch in schwierigen Situationen mit mehreren (auch ähnlich angezogenen) Personen robuste Lokalisierung und Tracking zu ermöglichen, untersuchten wir unterschiedliche geometrische und visuelle Merkmale. Dabei konnten wir sowohl neue Kostenfunktionen zur Verkettung der Objektdetektionen, als auch neue Objektmodelle aufzeigen. Durch die Verwendung dieser komplementären Informationsquellen konnten wir die Trackingergebnisse deutlich verbessern. Zusammengefasst kann gesagt werden, dass die gesteckten Ziele des Projekts klar erreicht, und sogar übertroffen wurden. Viele Ergebnisse des Projekts wurden bereits bei facheinschlägigen Tagungen und Journals publiziert.
- Technische Universität Graz - 100%
- Nassir Navab, TU München - Deutschland
- Pascal Fua, University of Lausanne - Schweiz
Research Output
- 2628 Zitationen
- 26 Publikationen
-
2011
Titel On-line Hough Forests DOI 10.5244/c.25.128 Typ Conference Proceeding Abstract Autor Schulter S Seiten 128.1-128.11 -
2013
Titel Alternating Decision Forests DOI 10.1109/cvpr.2013.72 Typ Conference Proceeding Abstract Autor Schulter S Seiten 508-515 -
2012
Titel Relaxed Pairwise Learned Metric for Person Re-identification DOI 10.1007/978-3-642-33783-3_56 Typ Book Chapter Autor Hirzer M Verlag Springer Nature Seiten 780-793 -
2014
Titel Occlusion Geodesics for Online Multi-Object Tracking. Typ Conference Proceeding Abstract Autor Bischof H Et Al Konferenz IEEE Conference on Computer Vision and Pattern Recognition (CVPR). -
2014
Titel Accurate Object Detection with Joint Classification-Regression Random Forests. Typ Conference Proceeding Abstract Autor Bischof H Et Al Konferenz IEEE Conference on Computer Vision and Pattern Recognition (CVPR). -
2014
Titel Hough Forests Revisited: An Approach to Multiple Instance Tracking from Multiple Cameras DOI 10.1007/978-3-319-11752-2_41 Typ Book Chapter Autor Poier G Verlag Springer Nature Seiten 499-510 -
2013
Titel Detecting Partially Occluded Objects with an Implicit Shape Model Random Field DOI 10.1007/978-3-642-37331-2_23 Typ Book Chapter Autor Wohlhart P Verlag Springer Nature Seiten 302-315 -
2013
Titel Optimizing 1-Nearest Prototype Classifiers. Typ Conference Proceeding Abstract Autor Bischof H Et Al Konferenz IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2013. -
2013
Titel Optimizing 1-Nearest Prototype Classifiers DOI 10.1109/cvpr.2013.66 Typ Conference Proceeding Abstract Autor Wohlhart P Seiten 460-467 -
2013
Titel Robust Real-Time Tracking of Multiple Objects by Volumetric Mass Densities DOI 10.1109/cvpr.2013.310 Typ Conference Proceeding Abstract Autor Possegger H Seiten 2395-2402 -
2014
Titel Accurate Object Detection with Joint Classification-Regression Random Forests DOI 10.1109/cvpr.2014.123 Typ Conference Proceeding Abstract Autor Schulter S Seiten 923-930 -
2014
Titel Occlusion Geodesics for Online Multi-Object Tracking DOI 10.1109/cvpr.2014.170 Typ Conference Proceeding Abstract Autor Possegger H Seiten 1306-1313 -
2015
Titel In Defense of Color-based Modelfree Tracking. Typ Conference Proceeding Abstract Autor Bischof H Et Al Konferenz IEEE Conference on Computer Vision and Pattern Recognition (CVPR). -
2015
Titel In Defense of Color-Based Model-Free Tracking DOI 10.1109/cvpr.2015.7298823 Typ Conference Proceeding Abstract Autor Possegger H Seiten 2113-2120 -
2015
Titel Encoding Based Saliency Detection for Videos and Images DOI 10.1109/cvpr.2015.7298864 Typ Conference Proceeding Abstract Autor Mauthner T Seiten 2494-2502 -
2013
Titel Hough-based tracking of non-rigid objects DOI 10.1016/j.cviu.2012.11.005 Typ Journal Article Autor Godec M Journal Computer Vision and Image Understanding Seiten 1245-1256 -
2013
Titel Alternating Decision Forests. Typ Conference Proceeding Abstract Autor Bischof H Et Al Konferenz IEEE Conference on Computer Vision and Pattern Recognition (CVPR). -
2013
Titel Robust Real-Time Tracking of Multiple Objects by Volumetric Mass Densities. Typ Conference Proceeding Abstract Autor Bischof H Et Al Konferenz IEEE Conference on Computer Vision and Pattern Recognition (CVPR). -
2012
Titel Discriminative Hough Forests for Object Detection DOI 10.5244/c.26.40 Typ Conference Proceeding Abstract Autor Wohlhart P Seiten 40.1-40.11 Link Publikation -
2012
Titel Large Scale Metric Learning From Equivalence Constraints. Typ Conference Proceeding Abstract Autor Bischof H Et Al Konferenz IEEE Conference on Computer Vision and Pattern Recognition (CVPR). -
2012
Titel Synergy-Based Learning of Facial Identity DOI 10.1007/978-3-642-32717-9_20 Typ Book Chapter Autor Köstinger M Verlag Springer Nature Seiten 195-204 -
2012
Titel Large Scale Metric Learning from Equivalence Constraints*The work was supported by the Austrian Science Foundation (FWF) project Advanced Learning for Tracking and Detection in Medical Workflow Analysis (I535-N23) and by the Austrian Research Promoti DOI 10.1109/cvpr.2012.6247939 Typ Conference Proceeding Abstract Autor Köstinger M Seiten 2288-2295 -
2012
Titel Hough Regions for Joining Instance Localization and Segmentation DOI 10.1007/978-3-642-33712-3_19 Typ Book Chapter Autor Riemenschneider H Verlag Springer Nature Seiten 258-271 -
2011
Titel Multi-camera Multi-object Tracking by Robust Hough-based Homography Projections DOI 10.1109/iccvw.2011.6130453 Typ Conference Proceeding Abstract Autor Sternig S Seiten 1689-1696 -
2011
Titel Multicamera Multi-object Tracking by Robust Hough-based Homography Projections. Typ Conference Proceeding Abstract Autor Bischof H Et Al Konferenz IEEE Workshop on Visual Surveillance (in conjunction with the International Conference on Computer Vision, ICCV). -
2003
Titel On Robust Regression in Photogrammetric Point Clouds DOI 10.1007/978-3-540-45243-0_23 Typ Book Chapter Autor Schindler K Verlag Springer Nature Seiten 172-178