Neuronale Netzwerke in unendlichen Dimensionen
Neural Networks in Infinite Dimensions
Wissenschaftsdisziplinen
Mathematik (100%)
Keywords
- Approximation Theory,
- Learning Theory,
- Neural Networks,
- Neural Operators,
- Barron Spaces,
- Complexity and Expressivity
Die moderne Wissenschaft muss häufig Regeln erlernen, die ein Feld in ein anderes überführen, etwa indem aus Eingabebedingungen eine vollständige Lösung entsteht, die sich über Raum und Zeit entwickelt. Neuronale Netze können das leisten, doch es fehlt weiterhin eine solide, transparente Theorie für sehr große oder sogar unendliche Szenarien. Diese Lücke führt zu praktischen Problemen: Es kann sehr viel Datenbedarf entstehen, das Training kann teuer sein, und die Genauigkeit ist schwer vorherzusagen. Dieses Projekt zielt darauf ab, eine strenge und zugleich praxistaugliche Grundlage für das Lernen solcher Regeln, sogenannter Operatoren, zu schaffen. Zunächst entwerfen wir eine neue Modellfamilie, die sowohl lokale Details als auch wellenartige Effekte erfasst, indem Phase und Amplitude auf transparente Weise gesteuert werden. Um die Theorie zu vertiefen, entwickeln wir zwei sich ergänzende Rahmenwerke, die Erkenntnisse aus der Signalanalyse und der Physik verbinden. Diese Rahmenwerke ermöglichen es, zu beschreiben, wie neuronale Netze komplexe Muster über Raum und Zeit erfassen und dabei die physikalischen Gesetzmäßigkeiten realer Systeme respektieren. In diesem Rahmen untersuchen wir, wann Lernen möglich ist, wie viele Daten benötigt werden und wie sich die Genauigkeit verbessert. Im Zentrum der Analyse steht das Konzept der Sparsität: komplexe Verhaltensweisen mit so wenigen grundlegenden Bausteinen wie möglich darzustellen. Indem wir untersuchen, wie Netzwerkarchitekturen und Aktivierungsfunktionen die Genauigkeit und Effizienz beeinflussen, quantifizieren wir die tatsächlichen Darstellungskosten des Operator-Lernens. Diese Erkenntnisse münden in ein einheitliches Rahmenwerk, das Fehlerschranken, Datenbedarf und Rechenaufwand verbindet und durch Prototyp-Algorithmen untermauert wird. Gelingen diese Ziele, entstehen schnellere und verlässlichere Modelle für zeit- und parameterabhängige Systeme, die durch partielle Differentialgleichungen, sowie weitere Operator- Lernprobleme, beschrieben werden. So können Ingenieurinnen und Ingenieure sowie Wissenschaftlerinnen und Wissenschaftler mit weniger Daten und Energie bessere Entscheidungen treffen und die Brücke zwischen mathematischer Strenge und praktikablem algorithmischem Design schlagen.
- Philipp Christian Petersen, Universität Wien , nationale:r Kooperationspartner:in
- Philipp Grohs, Universität Wien , nationale:r Kooperationspartner:in
- Samuel Lanthaler, Universität Wien , nationale:r Kooperationspartner:in
- Thomas Dittrich, Österreichische Akademie der Wissenschaften , nationale:r Kooperationspartner:in