Tiefe und Unterscheidbarkeit in tiefen neuronalen Netzen
Depth and Discriminability in Deep Learning Architectures
Wissenschaftsdisziplinen
Informatik (60%); Mathematik (40%)
Keywords
-
Discriminatory Properties,
Scattering Networks,
Deep Learning,
Deep Neural Networks
Die Entwicklung von Computersystemen, die in der Lage sind, komplexe kognitive Aufgabenstellungen in menschenähnlicher Weise zu bewältigen, ist das wesentliche Ziel von Forschung im Bereich der künstlichen Intelligenz. In den vergangenen Jahren wurden auf diesem Gebiet überraschend große Fortschritte erzielt. So ist es 2016 erstmals einem Computersystem gelungen, einen der der weltbesten Go-Spieler in einem Wettkampf zu besiegen. Auch konnten verbesserte Algorithmen zur Erkennung von Sprache oder Objekten in den letzten Jahren bisherige Erwartungen weit übertreffen. Die hier erzielten Fortschritte haben bereits spürbare Auswirkungen auf unseren Alltag und tragen zur Anwendbarkeit von Technologien wie Sprachsteuerungen und selbstfahrenden Autos bei. Die Grundlage für diese rasante Entwicklung bildet in vielen Fällen die Methode des sogenannten tiefen Lernens (engl. deep learning). Dabei handelt es sich um eine spezielle Art, Computersystemen Fertigkeiten, wie etwa das Erkennen von Ziffern, beizubringen. Die Grundidee ist dabei, stark vereinfachte Modelle von Netzwerkstrukturen im menschlichen Nervensystem in hierarchisch organisierten Schichten zu verknüpfen, und schließlich so zu adaptieren, dass sie in der Lage sind, spezifische Aufgaben zu lösen. Die ungemeine Leistungsfähigkeit solcherart konstruierter tiefer neuronaler Netzwerke ist unbestritten. Allerdings sind die dahinterliegenden Prinzipien, welche die aufregende Entwicklung der letzten Jahre erst ermöglicht haben, nach wie vor weitgehend unbekannt. Um diese Mechanismen zu entschlüsseln, arbeiten seit geraumer Zeit auch vermehrt Mathematiker*innen daran, tiefe neuronale Netzwerke mit mathematischen Methoden zu analysieren. Im Projekt Tiefe und Unterscheidbarkeit in tiefen neuronalen Netzwerken werden wir eine bestimmte, äußerst wichtige, Eigenschaft tiefer neuronaler Netze, nämlich deren Fähigkeit, auch in schwierigen Fällen gut zwischen verschiedenen Kategorien unterscheiden zu können, einer detaillierten mathematischen Analyse unterziehen. Wie schwierig es sein kann, verschiedene Objekte gut zu unterscheiden, lässt sich gut am Beispiel eines neuronalen Netzes veranschaulichen, dessen Ziel es ist, handgeschrieben Buchstaben korrekt zu erknnen. Um dies zu Bewerkstelligen ist es unter anderem notwendig, die Buchstaben u und v richtig voneinander unterscheiden zu können, obwohl diese in vielen Handschriften äußerst ähnlich aussehen. Ziel unseres Projektes ist es, besser zu verstehen, wie Tiefe, also die Anzahl hierarchisch angeordneter Schichten, und andere Eigenschaften eines neuronalen Netzwerkes dazu beitragen, dass auch äußerst ähnliche Elemente verschiedener Klassen korrekt voneinander unterschieden werden können. Dabei hoffen wir, dass unsere Arbeit dazu beitragen kann, zumindest einige der Mysterien hinter der erstaunlichen Leistungsfähigkeit tiefer neuronaler Netze zu entschlüsseln. Letztlich ist es aber auch Ziel unseres Projektes, Richtlinien und Kritierien zu definieren, die dabei helfen können, neuronale Netzwerkarchitekturen optimal für bestimmte Aufgabenstellungen in der Praxis anzupassen.
- Universität Wien - 100%
- Helmut Bölcskei, ETH Hönggerberg - Schweiz
Research Output
- 86 Zitationen
- 9 Publikationen
- 1 Disseminationen
-
2019
Titel Edge, Ridge, and Blob Detection with Symmetric Molecules DOI 10.48550/arxiv.1901.09723 Typ Preprint Autor Reisenhofer R -
2023
Titel Assessing the heterogeneity in the transmission of infectious diseases from time series of epidemiological data. DOI 10.1371/journal.pone.0286012 Typ Journal Article Autor Herrmann L Journal PloS one -
2022
Titel HARNet: A Convolutional Neural Network for Realized Volatility Forecasting DOI 10.2139/ssrn.4116642 Typ Preprint Autor Reisenhofer R Link Publikation -
2019
Titel Design for Extremes: A Contour Method for Defining Requirements Based on Multivariate Extremes DOI 10.1017/dsi.2019.149 Typ Journal Article Autor Haselsteiner A Journal Proceedings of the Design Society: International Conference on Engineering Design Seiten 1433-1442 Link Publikation -
2019
Titel Edge, Ridge, and Blob Detection with Symmetric Molecules DOI 10.1137/19m1240861 Typ Journal Article Autor Reisenhofer R Journal SIAM Journal on Imaging Sciences Seiten 1585-1626 Link Publikation -
2022
Titel Assessing the heterogeneity in the transmission of infectious diseases from time series of epidemiological data DOI 10.1101/2022.02.21.22271241 Typ Preprint Autor Schneckenreither G Seiten 2022.02.21.22271241 Link Publikation -
2022
Titel Solving the electronic Schrödinger equation for multiple nuclear geometries with weight-sharing deep neural networks DOI 10.1038/s43588-022-00228-x Typ Journal Article Autor Scherbela M Journal Nature Computational Science Seiten 331-341 -
2022
Titel HARNet: A Convolutional Neural Network for Realized Volatility Forecasting DOI 10.48550/arxiv.2205.07719 Typ Preprint Autor Reisenhofer R -
2021
Titel Solving the electronic Schrödinger equation for multiple nuclear geometries with weight-sharing deep neural networks DOI 10.48550/arxiv.2105.08351 Typ Preprint Autor Scherbela M