Partiell Synchrone Verteilte Echtzeitsysteme
Partially Synchronous Distributed Real-Time Systems
Wissenschaftsdisziplinen
Informatik (100%)
Keywords
-
Distributed computing models,
Real-time scheduling,
Partially synchronous systems,
Worst case response time analysis,
Fault-tolerant distr. real-time systems
Das Projekt "Partially Synchronous Distributed Real-Time Systems" (PSRTS) ist der Schaffung einer soliden wissenschaftlichen Basis für verteilte fehlertolerante Systeme mit harten Echtzeitanforderungen gewidmet, die im Gegensatz zu existierenden Architekturen einen hohen Grad an Parallelität zulassen und daher nicht "synchron per Konstruktion" sein können. Existierende synchrone Lösungen basieren auf einem feingranularen globalen Zeitbegriff, der es möglich macht, verteilt ablaufende Berechnungen eng miteinander zu synchronisieren: So kommunizieren z.B. im Falle des populären Time-Triggered Protocols TTP global zeitsynchronisierte Prozesse mittels Zeitschlitzverfahren (TDMA) über einen (redundanten) seriellen Bus. Während dieser Ansatz, der die Parallelität natürlich beträchtlich einschränkt, die Realisierung von Fehlertoleranz und Echtzeitfähigkeit stark erleichtert, macht er es auf der anderen Seite unmöglich, die gesamte Rechenleistung des verteilten Systems der Anwendung zur Verfügung zu stellen: Wegen des unvermeidlichen Overheads synchroner Berechnung und Kommunikation sind es im wesentlichen die langsamsten Teile des Systems, die die Gesamtgeschwindigkeit bestimmen. Abgesehen von der daraus resultierenden Verschwendung von Ressourcen besteht dadurch auch die Gefahr, die für die Realisierung von "Synchronität per Konstruktion" erforderlichen Schranken für die maximalen Verzögerungszeiten von Komponenten zu optimistisch abzuschätzen und somit das System gelegentlich außerhalb der Spezifikation zu betreiben. Angesichts der oftmals gravierenden Einschränkungen bezüglich des Energie- und Platzbedarfs von Automotive- und Aerospace-Anwendungen auf der einen und deren Sicherheitsanforderungen auf der anderen Seite ist es naheliegend, zu versuchen, den Grad der Parallelität im System zu erhöhen und somit sowohl die Verschwendung von Ressourcen als auch die Gefahr der Fehlspezifikation von kritischen Zeitparametern zu verkleinern. Die einschlägige Forschung hat mehrere Wege aufgezeigt, wie dies realisiert werden kann: Der Grad der Synchronität eines verteilten Echtzeitsystems kann im Wesentlichen zeitlich, räumlich oder aber algorithmisch reduziert werden. Wir konzentrieren uns ausschließlich auf den letzteren Ansatz, der aus der Forschungsperspektive besonders vielversprechend und herausfordernd erscheint: So gibt es zahlreiche Forschungsergebnisse im Bereich partiell synchroner verteilter Algorithmen, die als Ausgangsbasis herangezogen werden können. Auf der anderen Seite ist die Frage, wie man eine Analyse der Antwortzeiten in einem System durchführen kann, das nicht synchron per Konstruktion ist, nach unserem Kenntnisstand ein noch unerforschtes Gebiet. Das beantragte Projekt PSRTS hat genau diesen Durchschnitt der Gebiete verteilte Algorithmen und Echtzeitsysteme zum Gegenstand: Das konkrete Ziel ist es, durch Modifikation, Adaptierung und Erweiterung bestehender Ansätze die Theorie verteilter Algorithmen um eine angemessene Echtzeit-Perspektive zu erweitern. Das Projekt besteht aus drei klar umrissenen Teilbereichen: (1) Der Definition eines Distributed Real-Time Computing Models, das mit herkömmlichen Distributed Computing Models kompatibel ist, es aber auch erlaubt, alle relevanten Aspekte des Echtzeit-Schedulings und der Echtzeit-Analyse mit einzubeziehen, (2) der Auswahl und/oder Definition eines partiell synchronen Systemmodells, das synchron genug ist, um alle wichtigen Problemstellungen (wie z.B. Consensus) zu lösen, aber asynchron genug ist, um eine signifikante Parallelität der Berechnungen zu erlauben, und (3) die Entwicklung von Methoden und Techniken für eine hinreichend handhabbare aber dennoch realistische Analyse des Echtzeitverhaltens von mit (1) und (2) verträglichen verteilten Algorithmen, die es erlaubt, die immanente zyklische Abhängigkeit des Zeitverhaltens eines verteilten Algorithmus und des darunterliegenden verteilten Computersystems aufzulösen.
Das Projekt PSRTS (Partially Synchronous Distributed Real-Time Systems) war der Schaffung einer soliden wissenschaftlichen Basis für verteilte fehlertolerante Systeme mit harten Echtzeitanforderungen gewidmet, die im Gegensatz zu existierenden Architekturen einen hohen Grad an Parallelität zulassen und daher nicht synchron per Konstruktion sind. Im Gegensatz dazu basieren existierende synchrone Lösungen auf einem feingranularen globalen Zeitbegriff, der es möglich macht, verteilt ablaufende Berechnungen eng miteinander zu synchronisieren: So kommunizieren z.B. im Falle des populären Time-Triggered Protocols TTP global zeitsynchronisierte Prozesse mittels Zeitschlitzverfahren über einen (redundanten) Bus. Nun erleichtert dieser Ansatz zwar die Realisierung von Fehlertoleranz und Echtzeitfähigkeit sehr stark, macht es aber auf der anderen Seite unmöglich, die gesamte Rechenleistung des verteilten Systems der Anwendung zur Verfügung zu stellen: Wegen des unvermeidlichen Overheads synchroner Berechnung und Kommunikation sind es im Wesentlichen die langsamsten Teile des Systems, die die Gesamtgeschwindigkeit bestimmen. Abgesehen von der daraus resultierenden schlechten Auslastung, d.h., der Verschwendung von Ressourcen, besteht dadurch aber auch die Gefahr, das System gelegentlich außerhalb der Spezifikation zu betreiben. Angesichts der oftmals gravierenden Einschränkungen bezüglich des Energie- und Platzbedarfs z.B. in Automotive- und Aerospace-Anwendungen ist es wichtig, zu versuchen, den Grad der Parallelität im System zu erhöhen und somit sowohl die Verschwendung von Ressourcen als auch die Gefahr der Fehlspezifikation von kritischen Zeitparametern zu verkleinern. PSRTS war der Entwicklung der wissenschaftlichen Grundlagen für derartige Systeme gewidmet und hat folgende primären Ergebnisse erzielt:Ein umfassendes Real-Time Model, dem ersten verteilte Berechnungsmodell, das fehlertolerante verteilte Algorithmen mit einer realistischen Echtzeit-Analyse verträglich macht. Im Wesentlichen ersetzt es in Nullzeit ablaufende Zustandsübergänge durch zeitbehaftete, nichtunterbrechbare Operationen, wodurch Wartezeiten und Ablaufplanung relevant werden.Mehrere Instanzen von partiell synchronen Systemmodellen, wie dem zeitfreien Asynchronous Bounded Cycle Modell, die verschiedene Relaxationen von Synchronitätsbedingungen bieten, sowie passende Algorithmen für fehlertolerante verteilte Agreement-Probleme und entsprechende Beweistechniken. Komplexe (Echtzeit-)Analysetechniken, primär basierend auf nicht-standard Algebren, und ihre Anwendung auf Netzwerk-Algorithmen. Diese Methoden erlauben es, verteilte Systeme als lineare dynamische Systeme zu behandeln.Zusätzlich zu diesen primären Forschungsergebnissen hat PSRTS auch mehrere Folgeprojekte stimuliert, inklusive transdisziplinärer Forschung in Formaler Verifikation und in digitalen Integrierten Schaltungen
- Technische Universität Wien - 100%
Research Output
- 455 Zitationen
- 47 Publikationen
-
2012
Titel Agreement in Directed Dynamic Networks DOI 10.1007/978-3-642-31104-8_7 Typ Book Chapter Autor Biely M Verlag Springer Nature Seiten 73-84 -
2012
Titel Efficient Checking of Link-Reversal-Based Concurrent Systems DOI 10.1007/978-3-642-32940-1_34 Typ Book Chapter Autor Függer M Verlag Springer Nature Seiten 486-499 -
2013
Titel An infrastructure for accurate characterization of single-event transients in digital circuits DOI 10.1016/j.micpro.2013.04.011 Typ Journal Article Autor Veeravalli V Journal Microprocessors and Microsystems Seiten 772-791 Link Publikation -
2013
Titel On the performance of a retransmission-based synchronizer DOI 10.1016/j.tcs.2012.04.035 Typ Journal Article Autor Nowak T Journal Theoretical Computer Science Seiten 25-39 Link Publikation -
2012
Titel Agreement in Directed Dynamic Networks DOI 10.48550/arxiv.1204.0641 Typ Preprint Autor Biely M -
2012
Titel Architecture and Design Analysis of a Digital Single-Event Transient/Upset Measurement Chip DOI 10.1109/dsd.2012.26 Typ Conference Proceeding Abstract Autor Veeravalli V Seiten 8-17 -
2012
Titel Radiation-Tolerant Combinational Gates - An Implementation Based Comparison DOI 10.1109/ddecs.2012.6219036 Typ Conference Proceeding Abstract Autor Veeravalli V Seiten 115-120 -
2011
Titel Easy impossibility proofs for k-set agreement in message passing systems DOI 10.1145/1993806.1993846 Typ Conference Proceeding Abstract Autor Biely M Seiten 227-228 Link Publikation -
2011
Titel On the Performance of a Retransmission-Based Synchronizer DOI 10.1007/978-3-642-22212-2_21 Typ Book Chapter Autor Nowak T Verlag Springer Nature Seiten 234-245 -
2011
Titel Optimal regional consecutive leader election in mobile ad-hoc networks DOI 10.1145/1998476.1998485 Typ Conference Proceeding Abstract Autor Chung H Seiten 52-61 -
2011
Titel Reconciling fault-tolerant distributed computing and systems-on-chip DOI 10.1007/s00446-011-0151-7 Typ Journal Article Autor Függer M Journal Distributed Computing Seiten 323-355 Link Publikation -
2011
Titel Full Reversal Routing as a Linear Dynamical System DOI 10.1007/978-3-642-22212-2_10 Typ Book Chapter Autor Charron-Bost B Verlag Springer Nature Seiten 101-112 -
2011
Titel The Asynchronous Bounded-Cycle model DOI 10.1016/j.tcs.2010.08.001 Typ Journal Article Autor Robinson P Journal Theoretical Computer Science Seiten 5580-5601 Link Publikation -
2011
Titel Easy Impossibility Proofs for k-Set Agreement in Message Passing Systems DOI 10.1007/978-3-642-25873-2_21 Typ Book Chapter Autor Biely M Verlag Springer Nature Seiten 299-312 -
2011
Titel Solving k-set agreement with stable skeleton graphs. Typ Conference Proceeding Abstract Autor Biely M Konferenz T. Kikuno and T. Tsuchiya, editors: Proceedings 25th IEEE International Symposium on Parallel and Distributed Processing (IPDPS'11) Workshops -
2013
Titel Reconciling fault-tolerant distributed algorithms and real-time computing DOI 10.1007/s00446-013-0204-1 Typ Journal Article Autor Moser H Journal Distributed Computing Seiten 203-230 Link Publikation -
2010
Titel Real-time analysis of round-based distributed algorithms. Typ Conference Proceeding Abstract Autor Kössler A Konferenz Proceedings of the 1st International Real-Time Scheduling Open Problems Seminar (RTSOPS'10), in conjunction with 22nd Euromicro Conference on Real-Time Systems (ECRTS'10) -
2010
Titel Brief Announcement: Regional Consecutive Leader Election in Mobile Ad-Hoc Networks DOI 10.1007/978-3-642-16988-5_8 Typ Book Chapter Autor Chung H Verlag Springer Nature Seiten 89-91 -
2010
Titel How to Speed-up Fault-Tolerant Clock Generation in VLSI Systems-on-Chip via Pipelining DOI 10.1109/edcc.2010.35 Typ Conference Proceeding Abstract Autor Függer M Seiten 230-239 -
2010
Titel Regional consecutive leader election in mobile ad-hoc networks DOI 10.1145/1860684.1860701 Typ Conference Proceeding Abstract Autor Chung H Seiten 81-90 -
2022
Titel Hollow Gradient-Structured Iron-Anchored Carbon Nanospheres for Enhanced Electromagnetic Wave Absorption DOI 10.1007/s40820-022-00963-w Typ Journal Article Autor Wu C Journal Nano-Micro Letters Seiten 7 Link Publikation -
2009
Titel Weak Synchrony Models and Failure Detectors for Message Passing (k-)Set Agreement DOI 10.1007/978-3-642-10877-8_23 Typ Book Chapter Autor Biely M Verlag Springer Nature Seiten 285-299 -
2009
Titel Link Reversal: How to Play Better to Work Less DOI 10.1007/978-3-642-05434-1_10 Typ Book Chapter Autor Charron-Bost B Verlag Springer Nature Seiten 88-101 -
2009
Titel Weak synchrony models and failure detectors for message passing k-set agreement. Typ Conference Proceeding Abstract Autor Biely M Konferenz Proceedings of the 23rd International Symposium on Distributed Computing (DISC'09) -
2009
Titel On the Stability and Robustness of Non-Synchronous Circuits with Timing Loops. Typ Conference Proceeding Abstract Autor Függer M Konferenz 3rd Workshop on Dependable and Secure Nanocomputing, Estoril, Portugal -
2008
Titel The Asynchronous Bounded-Cycle Model DOI 10.1007/978-3-540-89335-6_20 Typ Book Chapter Autor Robinson P Verlag Springer Nature Seiten 246-262 -
2008
Titel Proceedings of the twenty-seventh ACM symposium on Principles of distributed computing, PODC '08 DOI 10.1145/1400751 Typ Journal Article -
2008
Titel The asynchronous bounded-cycle model DOI 10.1145/1400751.1400815 Typ Conference Proceeding Abstract Autor Robinson P Seiten 423-423 -
2008
Titel Chasing the Weakest System Model for Implementing O and Consensus DOI 10.1109/tdsc.2008.24 Typ Journal Article Autor Hutle M Journal IEEE Transactions on Dependable and Secure Computing Seiten 269-281 -
2008
Titel Optimal Deterministic Remote Clock Estimation in Real-Time Systems DOI 10.1007/978-3-540-92221-6_24 Typ Book Chapter Autor Moser H Verlag Springer Nature Seiten 363-387 -
2015
Titel Time Complexity of Link Reversal Routing DOI 10.1145/2644815 Typ Journal Article Autor Charron-Bost B Journal ACM Transactions on Algorithms (TALG) Seiten 1-39 Link Publikation -
2015
Titel The effect of forgetting on the performance of a synchronizer DOI 10.1016/j.peva.2015.08.002 Typ Journal Article Autor Függer M Journal Performance Evaluation Seiten 1-16 Link Publikation -
2014
Titel Architecture for Monitoring SET Propagation in 16-bit Sklansky Adder DOI 10.1109/isqed.2014.6783354 Typ Conference Proceeding Abstract Autor Veeravalli V Seiten 412-419 -
2018
Titel Gracefully degrading consensus and k-set agreement in directed dynamic networks DOI 10.1016/j.tcs.2018.02.019 Typ Journal Article Autor Biely M Journal Theoretical Computer Science Seiten 41-77 Link Publikation -
0
DOI 10.1145/1993806 Typ Other -
2009
Titel Towards a real-time distributed computing model DOI 10.1016/j.tcs.2008.10.012 Typ Journal Article Autor Moser H Journal Theoretical Computer Science Seiten 629-659 -
2009
Titel The Theta-Model: achieving synchrony without clocks DOI 10.1007/s00446-009-0080-x Typ Journal Article Autor Widder J Journal Distributed Computing Seiten 29-47 -
2009
Titel Brief announcement: How to speed-up fault-tolerant clock generation in VLSI systems-on-chip via pipelining. Typ Conference Proceeding Abstract Autor Dielacher A Konferenz Proceedings of the 28th ACM Symposium on Principles of Distributed Computing (PODC'09) -
2009
Titel Optimal message-driven implementations of omega with mute processes DOI 10.1145/1462187.1462191 Typ Journal Article Autor Biely M Journal ACM Transactions on Autonomous and Adaptive Systems (TAAS) Seiten 1-22 -
2009
Titel Routing without ordering DOI 10.1145/1583991.1584034 Typ Conference Proceeding Abstract Autor Charron-Bost B Seiten 145-153 -
2011
Titel Synchronous consensus under hybrid process and link failures DOI 10.1016/j.tcs.2010.09.032 Typ Journal Article Autor Biely M Journal Theoretical Computer Science Seiten 5602-5630 Link Publikation -
2011
Titel Brief announcement: Full reversal routing as a linear dynamical system. Typ Conference Proceeding Abstract Autor Charron-Bost B Konferenz Proceedings 23rd ACM Symposium on Parallelism in Algorithms and Architectures (SPAA'11) -
2011
Titel Reconciling Fault-Tolerant Distributed Algorithms and Real-Time Computing DOI 10.1007/978-3-642-22212-2_5 Typ Book Chapter Autor Moser H Verlag Springer Nature Seiten 42-53 -
2011
Titel Easy Impossibility Proofs for k-Set Agreement in Message Passing Systems DOI 10.48550/arxiv.1103.3671 Typ Preprint Autor Biely M -
2011
Titel Solving k-Set Agreement with Stable Skeleton Graphs DOI 10.48550/arxiv.1102.4423 Typ Preprint Autor Biely M -
2011
Titel Solving k-Set Agreement with Stable Skeleton Graphs DOI 10.1109/ipdps.2011.301 Typ Conference Proceeding Abstract Autor Biely M Seiten 1488-1495 Link Publikation -
2013
Titel The Effect of Forgetting on the Performance of a Synchronizer DOI 10.1007/978-3-642-45346-5_14 Typ Book Chapter Autor Függer M Verlag Springer Nature Seiten 185-200