Projektdetail

Wissenschaftsdisziplinen

Informatik (60%); Mathematik (40%)

Keywords

Discriminatory Properties, Scattering Networks, Deep Learning, Deep Neural Networks

Abstract

Die Entwicklung von Computersystemen, die in der Lage sind, komplexe kognitive Aufgabenstellungen in menschenähnlicher Weise zu bewältigen, ist das wesentliche Ziel von Forschung im Bereich der künstlichen Intelligenz. In den vergangenen Jahren wurden auf diesem Gebiet überraschend große Fortschritte erzielt. So ist es 2016 erstmals einem Computersystem gelungen, einen der der weltbesten Go-Spieler in einem Wettkampf zu besiegen. Auch konnten verbesserte Algorithmen zur Erkennung von Sprache oder Objekten in den letzten Jahren bisherige Erwartungen weit übertreffen. Die hier erzielten Fortschritte haben bereits spürbare Auswirkungen auf unseren Alltag und tragen zur Anwendbarkeit von Technologien wie Sprachsteuerungen und selbstfahrenden Autos bei. Die Grundlage für diese rasante Entwicklung bildet in vielen Fällen die Methode des sogenannten tiefen Lernens (engl. deep learning). Dabei handelt es sich um eine spezielle Art, Computersystemen Fertigkeiten, wie etwa das Erkennen von Ziffern, beizubringen. Die Grundidee ist dabei, stark vereinfachte Modelle von Netzwerkstrukturen im menschlichen Nervensystem in hierarchisch organisierten Schichten zu verknüpfen, und schließlich so zu adaptieren, dass sie in der Lage sind, spezifische Aufgaben zu lösen. Die ungemeine Leistungsfähigkeit solcherart konstruierter tiefer neuronaler Netzwerke ist unbestritten. Allerdings sind die dahinterliegenden Prinzipien, welche die aufregende Entwicklung der letzten Jahre erst ermöglicht haben, nach wie vor weitgehend unbekannt. Um diese Mechanismen zu entschlüsseln, arbeiten seit geraumer Zeit auch vermehrt Mathematiker*innen daran, tiefe neuronale Netzwerke mit mathematischen Methoden zu analysieren. Im Projekt Tiefe und Unterscheidbarkeit in tiefen neuronalen Netzwerken werden wir eine bestimmte, äußerst wichtige, Eigenschaft tiefer neuronaler Netze, nämlich deren Fähigkeit, auch in schwierigen Fällen gut zwischen verschiedenen Kategorien unterscheiden zu können, einer detaillierten mathematischen Analyse unterziehen. Wie schwierig es sein kann, verschiedene Objekte gut zu unterscheiden, lässt sich gut am Beispiel eines neuronalen Netzes veranschaulichen, dessen Ziel es ist, handgeschrieben Buchstaben korrekt zu erknnen. Um dies zu Bewerkstelligen ist es unter anderem notwendig, die Buchstaben u und v richtig voneinander unterscheiden zu können, obwohl diese in vielen Handschriften äußerst ähnlich aussehen. Ziel unseres Projektes ist es, besser zu verstehen, wie Tiefe, also die Anzahl hierarchisch angeordneter Schichten, und andere Eigenschaften eines neuronalen Netzwerkes dazu beitragen, dass auch äußerst ähnliche Elemente verschiedener Klassen korrekt voneinander unterschieden werden können. Dabei hoffen wir, dass unsere Arbeit dazu beitragen kann, zumindest einige der Mysterien hinter der erstaunlichen Leistungsfähigkeit tiefer neuronaler Netze zu entschlüsseln. Letztlich ist es aber auch Ziel unseres Projektes, Richtlinien und Kritierien zu definieren, die dabei helfen können, neuronale Netzwerkarchitekturen optimal für bestimmte Aufgabenstellungen in der Praxis anzupassen.

Forschungsstätte(n)

Universität Wien - 100%

Internationale Projektbeteiligte

Helmut Bölcskei, ETH Hönggerberg - Schweiz

Research Output

92 Zitationen
9 Publikationen
1 Disseminationen

Publikationen

Titel	Edge, Ridge, and Blob Detection with Symmetric Molecules
DOI	10.48550/arxiv.1901.09723
Typ	Preprint
Autor	Reisenhofer R

Titel	Design for Extremes: A Contour Method for Defining Requirements Based on Multivariate Extremes
DOI	10.1017/dsi.2019.149
Typ	Journal Article
Autor	Haselsteiner A
Journal	Proceedings of the Design Society: International Conference on Engineering Design
Seiten	1433-1442
Link	Publikation

Titel	Edge, Ridge, and Blob Detection with Symmetric Molecules
DOI	10.1137/19m1240861
Typ	Journal Article
Autor	Reisenhofer R
Journal	SIAM Journal on Imaging Sciences
Seiten	1585-1626
Link	Publikation

Titel	Solving the electronic Schrödinger equation for multiple nuclear geometries with weight-sharing deep neural networks
DOI	10.48550/arxiv.2105.08351
Typ	Preprint
Autor	Scherbela M

Titel	Assessing the heterogeneity in the transmission of infectious diseases from time series of epidemiological data
DOI	10.1371/journal.pone.0286012
Typ	Journal Article
Autor	Schneckenreither G
Journal	PLOS ONE
Link	Publikation

Titel	HARNet: A Convolutional Neural Network for Realized Volatility Forecasting
DOI	10.2139/ssrn.4116642
Typ	Preprint
Autor	Reisenhofer R
Link	Publikation

Titel	Solving the electronic Schrödinger equation for multiple nuclear geometries with weight-sharing deep neural networks
DOI	10.1038/s43588-022-00228-x
Typ	Journal Article
Autor	Scherbela M
Journal	Nature Computational Science
Seiten	331-341

Titel	HARNet: A Convolutional Neural Network for Realized Volatility Forecasting
DOI	10.48550/arxiv.2205.07719
Typ	Preprint
Autor	Reisenhofer R

Titel	Assessing the heterogeneity in the transmission of infectious diseases from time series of epidemiological data
DOI	10.1101/2022.02.21.22271241
Typ	Preprint
Autor	Schneckenreither G
Seiten	2022.02.21.22271241
Link	Publikation

Disseminationen

Titel	Epimath
Typ	Engagement focused website, blog or social media channel
Link	Link

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

Tiefe und Unterscheidbarkeit in tiefen neuronalen Netzen

Depth and Discriminability in Deep Learning Architectures

Wissenschaftsdisziplinen

Keywords

Research Output

Kontakt

Allgemeines

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

SOCIAL MEDIA

SCILOG

Tiefe und Unterscheidbarkeit in tiefen neuronalen Netzen

Depth and Discriminability in Deep Learning Architectures

Wissenschaftsdisziplinen

Keywords

Research Output