Grundlegende Abwägungen bei der Einbettung von Informationen
Fundamental Tradeoffs for Information Hiding (DETERMINE)
Weave: Österreich - Belgien - Deutschland - Luxemburg - Polen - Schweiz - Slowenien - Tschechien
Wissenschaftsdisziplinen
Elektrotechnik, Elektronik, Informationstechnik (20%); Informatik (80%)
Keywords
-
Information Security,
Information Hiding,
Watermarking,
Steganography,
Large Language Model,
Generative Models
Wie lassen sich Daten in Daten sicher verstecken? Diese Frage beschäftigt die Informatik seit Langem und bekommt mit dem Durchbruch generativer künstlicher Intelligenz (KI) neue Bedeutung. Generierte Mediendaten, wie z.B. die Ausgabe von KI-Chat-Bots, können Träger von versteckten digitalen Wasserzeichen sein, mit welchen sich die Herkunft oder Echtheit der Information nachweisen lässt. Beispielsweise könnten Durchbrüche in der Forschung es ermöglichen, von großen Sprachmodellen generierte und mit digitalen Wasserzeichen markierte Texte automatisiert und mit hoher Sicherheit als solche zu erkennen, selbst wenn diese nachträglich leicht abgeändert wurden. Darüber hinaus kann generative KI auch zum Einbringen völlig neuartiger Wasserzeichen in konventionellen Mediendaten verwendet werden. Eine genaue Analyse der neuartigen, maschinell erlernten Wasserzeichen verspricht neue Erkenntnisse, wie man Daten noch sicherer verstecken könnte als bisher bekannt. Je nach Wahl des Zielkriterien in der Lernphase können unterschiedliche Eigenschaften realisiert werden, wie z.B. Unentdeckbarkeit, Robustheit oder hohe Kapazität. Unentdeckbarkeit ist eine Voraussetzung für sichere Steganographie zur höchst vertraulichen Kommunikation. Steganographie erreicht noch mehr Sicherheit als eine kryptographische Verschlüsselung, weil selbst die Existenz der vertraulichen Informationen verborgen bleibt. Sichere Steganographie ist die Grundlage für zensurresistente Kommunikationssysteme. Robustheit ist eine Voraussetzung für den praktischen Einsatz digitaler Wasserzeichen, welche auch nach Veränderung des Mediums (z.B. verlustbehaftete Übertragung, Bearbeitung durch Filter) noch lesbar sein sollen. Die Kapazität gibt an, wie viele Daten man relativ zur Größe des Trägermediums verstecken kann. Unentdeckbarkeit, Robustheit und Kapazität stehen in einem Zielkonflikt. Die exakten Zusammenhänge und Grenzen sind aber noch unbekannt und müssen sowohl allgemein als auch für jeden Medientyp (Text, Bild, Audio, komprimiertes Video) spezifisch erforscht werden. Eine besondere Herausforderung ist unter anderem, die menschliche Wahrnehmung von veränderten Mediendaten für Computer messbar zu machen. Ein Forschungsteam am Institut für Informatik der Universität Innsbruck unter der Leitung von Univ.-Prof. Dr. Rainer Böhme untersucht gemeinsam mit Wissenschaftlerinnen und Wissenschaftlern der Tschechischen Technischen Universität in Prag die Grundlagen des sicheren Versteckens von Informationen im Kontext der generativen KI. Das vom FWF und der GACR geförderte bilaterale Projekt ist auf drei Jahre angelegt und wird den Stand der Forschung in den Bereichen Daten- und Informationssicherheit, Signalverarbeitung und maschinelles Lernen vorantreiben.
- Universität Innsbruck - 100%
- Patrick Bas, Université de Lille - Frankreich
- Tomas Penvy, Czech Technical University in Prague - Tschechien
- Andrew Ker, University of Oxford - Vereinigtes Königreich