Seminar Fehlertolerante Systeme (2005)

Prof. Dr. habil. Andreas Polze

Dipl. Inf. Andreas Rasche
Dipl.-Inf Peter Tröger

Im Sommersemester 2005 findet ein Seminar zum Thema Fehlertolerante Systeme statt. Das Seminar richtet sich an Studierende des Master-Studienganges Softwaresystemtechnik und wird einem der Themengebiete Softwaresystemtechnische Vertiefungsthemen oder Freie Informatikvertiefungsthemen zugerechnet. Voraussetzung für das Seminar ist Standardwissen zur Architektur von Betriebssystemen (VL Prof. Polze) und zur Rechnerkommunikation (VL Prof. Zorn).

Das Seminar konzentriert sich auf die Arbeit mit wissenschaftlichen Publikationen und Buchartikeln. Dabei sollen wichtige, grundlegende Erkenntnisse aus ausgewählten Veröffentlichungen auf dem Gebiet der fehlertoleranten Systeme erarbeitet und referiert werden. Die Teilnehmer sollen insbesondere Techniken der wissenschaftlichen Recherche erlernen und praktizieren.

Von den Teilnehmern wird ein 45-50 minütiger Vortrag mit anschließender Diskussion und Auswertung (25-30 Minuten) erwartet. Zwei Wochen vor dem Vortragstermin sollten in einer Vorbesprechung die Vortragsunterlagen (Folien oder Tafelbild) bei einem Betreuer vorgestellt werden. Zum Seminar werden wöchentliche Konsultationen angeboten. Das Seminar ist unbenotet und wird mit 3 Belegungspunkten angerechnet.

Termin: Mittwoch, 11:00 Uhr - 12:30 Uhr, Raum A 1.1

Themenvergabe: 13.4.2005

Liste der Seminarvorträge:

Termin Vortragende(r) Betreuer Thema
13.4 Prof. Polze Themeneinführung, Grundlagen wissenschaftlicher Recherche
4.5. Dominik Tornow
(Vortrag)
A.Rasche Grundlagen und Begriffe für zuverlässige Systeme (Reliability, Dependability, Availability ...)
Reliability-Modelle, Failure-Modelle, Fehler-Bäume
"Dependability: Basic Concepts and Terminologie", J.C. Laprie
"Understanding Fault-Tolerant Distributed Systems", F. Christian
"Fault-Tolerance in the advance automation system", F. Christian et. al.
11.5 Alexey Raskatov P.Tröger Replikation (Gossip)
"Providing Availability using Lazy Replication", R. Ladin
18.5 Johannes Scheerer
(Vortrag)
P.Tröger Uhrensynchronisation
"Time, Clocks and the Ordering of Events in a Distributed System", L. Lamport
"On the possibility and impossibility of achieving clock synchronization", D.Dolev et. al.
25.5 Mario Oschwald
(Vortrag)
P.Tröger Gruppenkommunikation und Reliable Multicast
"Reliable communication in the presence of failures", K.Birman, T. Joseph
"Time, Clocks and the Ordering of Events in a Distributed System", L. Lamport
1.6 Matthias Wiemann
(Vortrag)
P.Tröger Die byzantinischen Generäle
"Byzantine Generals Problem", L. Lamport et.al.
"Authenticated algorithms for byzantine agreement", D. Dolev et.al.
8.6 Jan-Henry Ohlert
(Vortrag)
A.Rasche Software-Fehlertoleranz ( Recovery Blocks, Acceptance Tests, Checkpointing)
"A Program Structure For Error Detection And Recovery", J.J. Horning et.al.
"Software Fault Tolerance: A Tutorial", W.Torres-Pomales
15.6 A.Rasche N-Version Programming
"The Methodology of N-Version Programming", A.Avizienis
22.6 P.Tröger Fault Injection
"Fault-Injection-Based Testing of Fault-Tolerant Algorithms in Message-Passing Parallel Computers", D.M. Blough et.al.
Failure Detectors
"Unreliable failure detectors for reliable distributed systems", T.Chandra and S. Toueg
15.6. Georg Köster
(Vortrag)
A.Rasche The Simplex Approach
"Using Simplicity to Control Complexity", L.Sha
"Dependable System Upgrade", L. Sha
22.6. Alexander Renneberg
(Vortrag)
A.Rasche Boeing 777 Flight Controller
"Triple-Triple Redundant 777 Primary Flight Computer", Y.C. Yeh