Selbststabilisierende Byzantin. Fehlertol. Verteilte Algorithmen für Integrierte Schaltungen
Self-stabilizing Byzantine Fault-Tolerant Distributed Algorithms for Integrated Circuits
Wissenschaftsdisziplinen
Elektrotechnik, Elektronik, Informationstechnik (20%); Informatik (60%); Mathematik (20%)
Keywords
-
Distributed algorithms,
VLSI Circuits,
Self-stabilization,
Byzantine fault-tolerance
Dieses Projekt ist der Verwendung von selbststabilisierenden Byzantinisch fehlertoleranten verteilten Algorithmen zur Realisierung von robusten very-large scale integrierten (VLSI) Schaltungen gewidmet. Konkreter Gegenstand ist die Entwicklung der Grundlagen eines Frameworks für die Modellierung und Analyse solcher Algorithmen und deren Anwendung auf einige repräsentative Problemstellungen in VLSI-Schaltungen. Neben permanenten Fehlern etwa durch Fertigungsdefekte und Elektromigration sind es vor allem transiente Fehler, wie sie z.B. durch ionisierende Teilchen, elektromagnetische Einstreuungen oder zeitweilig illegale Betriebsbedingungen verursacht werden, die die Zuverlässigkeit moderner integrierter Schaltungen insbesondere im Aerospace-Bereich beeinträchtigen. Anders als klassische Fehlertoleranzmechanismen wie triple modular reduncancy sind selbststabilisierende Algorithmen in der Lage, sich von einer beliebigen Anzahl von transienten Fehlern zu erholen; Byzantinisch fehlertolerante selbststabilisierende Algorithmen erlauben dies sogar in Anwesenheit von permanenten Fehlern. Byzantinisch fehlertolerante selbststabilisierende Algorithmen, die in VLSI-Schaltungen eingesetzt werden sollen, stehen vor besonderen Herausforderungen, die von existierenden Lösungen in keinster Weise berücksichtigt wurden. Zunächst einmal sind Millionen von einfachen logischen Gattern, die kontinuierlich den Wert ihrer Ausgangssignale in Abhängigkeit vom (früheren) Wert ihrer Eingangssignale berechnen, nicht mit den klassischen diskreten Automaten modellierbar, wie sie für verteilte Algorithmen verwendet werden. Darüberhinaus stellen integrierte Schaltungen nur sehr einfache elementare Operationen und Kommunikationsmechanismen zur Verfügung. Existierende selbststabilisierende Algorithmen und existierende Modellierungs- und Analyse- Frameworks können daher ohne grundlegende Modifikationen nicht im VLSI-Kontext verwendet werden. Nichts desto trotz zeigt ein kürzlich von uns (gemeinsam mit Danny Dolev/Hebrew University and Christoph Lenzen/Weizmann Institute) entwickeltes Verfahren für die Byzantinisch fehlertolerante selbststabilisierende Taktgenerierung in VLSI-Schaltungen, daß dies grundsätzlich möglich ist. Das konkrete Ziel von SIC ist die Entwicklung der Grundlagen eines Frameworks für die Modellierung und Analyse von Byzantinisch fehlertolerante selbststabilisierende Algorithmen für VLSI-Schaltungen. Die in SIC geplanten Forschungsarbeiten umfassen grundlegende Forschungsfragen im Bereich wohldefinierter und vollständiger mathematischer Beschreibungen des Stabilisierungsprozesses und digitaler Modelle für die Generierung und Ausbreitung von Metastabilität, die im Falle selbststabilisierender Algorithmen nicht mehr allein mit Engineering-Methoden adäquat behandelt werden können. Diese Arbeiten werden ergänzt durch die Entwicklung von Byzantinisch fehlertoleranten selbststabilisierenden Algorithmen für einige repräsentative Probleme in VLSI-Schaltungen, wie verteilte Taktgenerierung und reliable broadcast. Unter Verwendung des vorgestellten Frameworks werden Korrektheitsbeweise und Performance-Analysen dieser Algorithmen unter adäquaten Fehlermodellen erstellt; die praktische Implementierbarkeit der Algorithmen wird mit Hilfe von Simulationen und FPGA Prototyp-Entwicklungen demonstriert, die auch eine experimentelle Evaluation erlauben.
Im Projekt SIC wurden algorithmische Wege zur Verbesserung der Robustheit von Schaltungen untersucht. Motivation. Während es zahlreiche Studien zur Verbesserung von Fehleranfälligkeit auf Schaltkreisebene (Wahl der Materialien etc.) und auf Softwareebene gibt, sind algorithmische Techniken weniger untersucht. Ansatz. Interessanterweise können VLSI Schaltungen auf mehreren Abstraktionsebenen alsverteilte Systeme modelliert werden: von den Gattern die untereinander binär kommunizieren, bis zu Modulen eines Network on Chip (NoC). Die Idee in SIC war Techniken aus dem Bereich der verteilten Algorithmen zu verwenden um die Robustheit von VLSI Schaltungen zu steigern. Typischerweise, und im Gegensatz zu klassischen verteilten Systemen, sind die einzelnen Prozesse eines solchen Systems wesentlich eingeschränkt in ihrer Art zu Kommunizieren und zu Berechnen. Ein Fokus von SIC wurde auf selbststabilisierende Algorithmen gelegt: ein System löst ein Problem selbststabilisierend, wenn es aus jedem beliebigen Zustand des Systems das Problem löst. Selbststabilisierende Algorithmen sind in Missionen in denen korrumpierte Zustände nicht leicht behoben werden können (z.B. in der Raumfahrt) von Interesse. Resultate. Wir versuchten den obigen Herausforderungen mit unterschiedlichen Herangehensweisen zu begegnen. (i) Wir schlugen ein Modell der verteilten Algorithmen vor, welches für eine formale Analyse von Algorithmen für VLSI Schaltungen geeignet ist. Im Speziellen designten wir einen fehlertoleranten, selbststabilisierenden und verteilten Taktgenerierungs Algorithmus und bewiesen seine Korrektheit. (ii) Wir zeigten ein Problem in bestehenden binären Schaltkreismodellen auf. In nachfolgenden Publikationen präsentierten wir Modelle die dieses Problem umgingen. (iii) Metastabilität ist ein unerlässlicher dritter Zustand in dem jedes bistabile Gatter, z.B. ein Flip-op, unbegränzt lange verweilen kann. Elemente die metastabil werden, können zu Fehlern in nachfolgenden Gattern führen wenn sie von diesen während der Metastabilität gelesen werden. Klassisch wird dies durch Warten vermieden, da Metastabilität nur kurzlebig ist. Wir demonstrierten, dass Warten nicht notwendig ist und dass mit Metastabilität gerechnet werden kann. Im Weiteren untersuchten wir das genauere Verhalten von metastabilen Gattern. (iv) Wir kombinierten die obigen Techniken zu neuen robusten on-chip Services: robuste verteilte Takt Generierung, Takt Verteilung,TaktFrequenzadaption beiAuftreten vonSpannungseinbrüchen, Kommunikationsinfrastruktur auf einem Chip, anhaltbarer Takt, etc. (v) Wir studierten Algorithmen für Consensus-ähnliche Probleme. Der Fokus war hierbei auf dynamischen Netzen.
- Technische Universität Wien - 100%
- Danny Dolev, The Hebrew University of Jerusalem - Israel
- Christoph Lenzen, MIT - Massachusetts Institute of Technology - Vereinigte Staaten von Amerika
Research Output
- 221 Zitationen
- 38 Publikationen
-
2018
Titel A Faithful Binary Circuit Model with Adversarial Noise DOI 10.23919/date.2018.8342219 Typ Conference Proceeding Abstract Autor Függer M Seiten 1327-1332 Link Publikation -
2018
Titel Gracefully degrading consensus and k-set agreement in directed dynamic networks DOI 10.1016/j.tcs.2018.02.019 Typ Journal Article Autor Biely M Journal Theoretical Computer Science Seiten 41-77 Link Publikation -
2018
Titel Tight Bounds for Asymptotic and Approximate Consensus DOI 10.1145/3212734.3212762 Typ Conference Proceeding Abstract Autor Függer M Seiten 325-334 Link Publikation -
2017
Titel A Model for the Metastability Delay of Sequential Elements DOI 10.1142/s0218126617400102 Typ Journal Article Autor Polzer T Journal Journal of Circuits, Systems and Computers Seiten 1740010 Link Publikation -
2017
Titel Metastability Tolerant Computing DOI 10.1109/async.2017.9 Typ Conference Proceeding Abstract Autor Tarawneh G Seiten 25-32 Link Publikation -
2017
Titel Measuring Metastability with Free-Running Clocks DOI 10.1109/async.2017.18 Typ Conference Proceeding Abstract Autor Najvir R Seiten 18-24 -
2017
Titel Measuring Metastability Using a Time-to-Digital Converter DOI 10.1109/ddecs.2017.7934582 Typ Conference Proceeding Abstract Autor Polzer T Seiten 116-121 -
2017
Titel New transience bounds for max-plus linear systems DOI 10.1016/j.dam.2016.11.003 Typ Journal Article Autor Charron-Bost B Journal Discrete Applied Mathematics Seiten 83-99 -
2019
Titel The Involution Tool for Accurate Digital Timingand Power Analysis DOI 10.1109/patmos.2019.8862165 Typ Conference Proceeding Abstract Autor Öhlinger D Seiten 1-8 Link Publikation -
2018
Titel Using a Duplex Time-to-Digital Converter for Metastability Characterization of an FPGA DOI 10.1109/ddecs.2018.00032 Typ Conference Proceeding Abstract Autor Huemer F Seiten 141-146 -
2018
Titel Fast All-Digital Clock Frequency Adaptation Circuit for Voltage Droop Tolerance DOI 10.1109/async.2018.00025 Typ Conference Proceeding Abstract Autor Függer M Seiten 68-77 Link Publikation -
2018
Titel Self-Stabilizing High-Speed Communication in Multi-Synchronous GALS Architectures DOI 10.1109/iolts.2018.8474221 Typ Conference Proceeding Abstract Autor Perner M Seiten 157-164 -
2019
Titel An Experimental Study of Metastability-Induced Glitching Behavior DOI 10.1142/s0218126619400061 Typ Journal Article Autor Polzer T Journal Journal of Circuits, Systems and Computers Seiten 1940006 -
2021
Titel Fast All-Digital Clock Frequency Adaptation Circuit for Voltage Droop Tolerance DOI 10.1109/tcad.2021.3097599 Typ Journal Article Autor Függer M Journal IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems Seiten 2518-2531 Link Publikation -
2019
Titel A Faithful Binary Circuit Model DOI 10.1109/tcad.2019.2937748 Typ Journal Article Autor Függer M Journal IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems Seiten 2784-2797 Link Publikation -
2019
Titel Transistor-Level Analysis of Dynamic Delay Models DOI 10.1109/async.2019.00019 Typ Conference Proceeding Abstract Autor Maier J Seiten 76-85 Link Publikation -
2018
Titel Metastability-Containing Circuits DOI 10.1109/tc.2018.2808185 Typ Journal Article Autor Friedrichs S Journal IEEE Transactions on Computers Seiten 1167-1183 Link Publikation -
2018
Titel Refined metastability characterization using a time-to-digital converter DOI 10.1016/j.microrel.2017.11.017 Typ Journal Article Autor Polzer T Journal Microelectronics Reliability Seiten 91-99 Link Publikation -
2014
Titel Rigorously modeling self-stabilizing fault-tolerant circuits: An ultra-robust clocking scheme for systems-on-chip DOI 10.1016/j.jcss.2014.01.001 Typ Journal Article Autor Dolev D Journal Journal of Computer and System Sciences Seiten 860-900 Link Publikation -
2017
Titel Metastability-Aware Memory-Efficient Time-to-Digital Converters DOI 10.1109/async.2017.12 Typ Conference Proceeding Abstract Autor Függer M Seiten 49-56 Link Publikation -
2014
Titel Equivalence of Clock Gating and Synchronization with Applicability to GALS Communication DOI 10.1109/patmos.2014.6951873 Typ Conference Proceeding Abstract Autor Najvirt R Seiten 1-8 -
2014
Titel Fault-tolerant algorithms for tick-generation in asynchronous logic DOI 10.1145/2560561 Typ Journal Article Autor Dolev D Journal Journal of the ACM (JACM) Seiten 1-74 Link Publikation -
2020
Titel On the radius of nonsplit graphs and information dissemination in dynamic networks DOI 10.1016/j.dam.2020.02.013 Typ Journal Article Autor Függer M Journal Discrete Applied Mathematics Seiten 257-264 Link Publikation -
2016
Titel Fast consensus under eventually stabilizing message adversaries DOI 10.1145/2833312.2833323 Typ Conference Proceeding Abstract Autor Schwarz M Seiten 1-10 Link Publikation -
2016
Titel Does Cascading Schmitt-Trigger Stages Improve the Metastable Behavior? DOI 10.1109/dsd.2016.56 Typ Conference Proceeding Abstract Autor Steininger A Seiten 372-379 Link Publikation -
2016
Titel The Metastable Behavior of a Schmitt-Trigger DOI 10.1109/async.2016.19 Typ Conference Proceeding Abstract Autor Steininger A Seiten 57-37 Link Publikation -
2015
Titel Experimental Validation of a Faithful Binary Circuit Model DOI 10.1145/2742060.2742081 Typ Conference Proceeding Abstract Autor Najvirt R Seiten 355-360 Link Publikation -
2015
Titel Upper Miocene endemic lacustrine gastropod fauna of the Turiec Basin: addressing taxonomic, paleobiogeographic and stratigraphic issues DOI 10.1515/geoca-2015-0016 Typ Journal Article Autor Neubauer T Journal Geologica Carpathica Seiten 139-156 Link Publikation -
2016
Titel HEX: Scaling honeycombs is easier than scaling clock trees DOI 10.1016/j.jcss.2016.03.001 Typ Journal Article Autor Dolev D Journal Journal of Computer and System Sciences Seiten 929-956 Link Publikation -
2015
Titel Towards binary circuit models that faithfully capture physical solvability DOI 10.7873/date.2015.0799 Typ Conference Proceeding Abstract Autor Fugger M Seiten 1455-1460 Link Publikation -
2015
Titel A Versatile and Reliable Glitch Filter for Clocks DOI 10.1109/patmos.2015.7347599 Typ Conference Proceeding Abstract Autor Najvirt R Seiten 140-147 -
2015
Titel A Pausible Clock with Crystal Oscillator Accuracy DOI 10.1109/ecctd.2015.7300051 Typ Conference Proceeding Abstract Autor Najvirt R Seiten 1-4 -
2015
Titel How to Synchronize a Pausible Clock to a Reference DOI 10.1109/async.2015.10 Typ Conference Proceeding Abstract Autor Najvirt R Seiten 9-16 -
2015
Titel Gracefully Degrading Consensus and k-Set Agreement in Directed Dynamic Networks DOI 10.1007/978-3-319-26850-7_8 Typ Book Chapter Autor Biely M Verlag Springer Nature Seiten 109-124 -
2015
Titel On the Appropriate Handling of Metastable Voltages in FPGAs DOI 10.1142/s021812661640020x Typ Journal Article Autor Polzer T Journal Journal of Circuits, Systems and Computers Seiten 1640020 Link Publikation -
2015
Titel The effect of forgetting on the performance of a synchronizer DOI 10.1016/j.peva.2015.08.002 Typ Journal Article Autor Függer M Journal Performance Evaluation Seiten 1-16 Link Publikation -
2015
Titel Time Complexity of Link Reversal Routing DOI 10.1145/2644815 Typ Journal Article Autor Charron-Bost B Journal ACM Transactions on Algorithms (TALG) Seiten 1-39 Link Publikation -
2016
Titel Unfaithful Glitch Propagation in Existing Binary Circuit Models DOI 10.1109/tc.2015.2435791 Typ Journal Article Autor Fugger M Journal IEEE Transactions on Computers Seiten 964-978 Link Publikation