Failure detection and recovery using consensus algorithms in a distributed resource management framework

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Failure detection and recovery using consensus algorithms in a distributed resource management framework (EN)

Μασούρος, Δημοσθένης (EL)
Masouros, Dimosthenis (EN)

Οικονομάκος, Γεώργιος (EL)
ntua (EL)
Σούντρης, Δημήτριος (EL)
Πεκμεστζή, Κιαμάλ (EL)

bachelorThesis

2016-07-21
2016-09-14T10:10:03Z
2016-09-14


Η παρούσα διπλωματική εργασία επικεντρώνεται στην ανίχνευση αδιεξόδων και σφαλμάτων καθώς και στην ανάνηψη σε περίπτωση που αυτά συμβούν σε κάποιο Πολυ-Πύρηνο Συστήμα σε Ψηφίδα. Συγκεκριμένα, εξετάζουμε συστήματα τα χρησιμοποιούν αρχιτεκτονική Δικτύου-σε-Ψηφίδα. Η τεχνολογία αυτή παρουσιάζει πολλές ομοιότητες με την ιδέα των κατανεμημένων συστημάτων κυρίως στον τρόπο επικοινωνίας και της ιδέας κατανομής πόρων. Για το λόγο αυτό, στόχος της παρούσας διπλωματικής είναι η υλοποίηση γνωστών αλγορίθμων στον τομέα των κατανεμημένων συστημάτων σε ένα πλαίσιο κατανομής πόρων το οποίο διαχειρίζεται εφαρμογές σε ένα σύστημα σε ψηφίδα. Στο κεφάλαιο 1, κάνουμε μία εισαγωγή πάνω στα κατανεμημένα συστήματα, στα συστήματα με αρχιτεκτονική δικτύου ψηφίδας καθώς και τις έννοιες της αξιοπιστίας, ανοχής σε σφάλματα και ομοφωνίας. Στο κεφάλαιο 2, παρουσιάζουμε εργασίες και υλοποιήσεις τεχνολογιών οι οποίες επικεντρώνονται στην ανάνηψη συστημάτων από σφάλματα. Στο κεφάλαιο 3, 4, 5 και 6 αναλύουμε τους τρόπους επικοινωνίας και τα είδη σφαλμάτων σε κατανεμημένα συστήματα καθώς τους τρόπους με τους οποίους μπορούμε να εντοπίσουμε αδιέξοδα και σφάλματα. Επίσης, παρουσιάζουμε ένα πλαίσιο κατανομής πόρων, γνωστό ως DRTRM, πάνω στο οποίο θα ενσωματώσουμε τους αλγορίθμους για εντοπισμό σφαλμάτων και αδιεξόδων καθώς και το πρωτόκολλο ανάνηψης σε περίπτωση σφάλματος PAXOS. Στο κεφάλαιο 7, αναλύουμε τη διαδικασία την οποία ακολουθήσαμε προκειμένου να ενσωματώσουμε τον PAXO καθώς και τους ανιχνευτές σφαλμάτων στο πλαίσιο κατανομής πόρων. Στο κεφάλαιο 8, εξετάζουμε διαφορετικά σενάρια σφαλμάτων και παρουσιάζουμε τα πειραματικά αποτελέσματα. Στο κεφάλαιο 9 συνοψίζουμε τα συμπεράσματά μας και προτείνουμε ιδέες για μελλοντική έρευνα. (EL)
This diploma thesis focuses on deadlock and failure detection as well as recovery in case of failure on a Multi-Processor System-on-Chip (MPSoC). More precisely, we examine systems which utilize the Network-on-Chip (NoC) architecture. These types of systems share many similarities with a distributed system, specifically in the communication scheme and the allocation of resources. Thus, we implemented some popular algorithms which appear in distributed systems, on top of a resource management framework that manages applications on a MPSoC. In chapter 1, we introduce the class of distributed systems and systems with a NoC architecture and proceed with the basic concepts of reliability and consensus. In chapter 2, we present published works and real-life implementations which focus on recovery after failure. In chapters 3, 4, 5 and 6 we analyze the different communication methods and the types of failures that occur in distributed systems, as well as the ways in which we can detect failures and deadlocks. In addition, we present the DRTRM resource management framework, which was used to implement the deadlock and failure detection algorithms and the PAXOS protocol, which is used to recover in case of failure. In chapter 7, we give detailed information on how we merged PAXOS and detectors with the DRTRM framework. In chapter 8, we examine different failure scenarios and we present our theoretical and experimental results. Lastly, in chapter 9 we summarize our conclusions and propose ways and ideas for future research. (EN)


Εντοπισμός αδιεξόδων (EL)
Σύστημα-σε-ψηφίδα (EL)
Ομοφωνία (EL)
Εντοπισμός σφαλμάτων (EL)
Πολυ-πύρηνο δίκτυο σε ψηφίδα (EL)
Multi-processor system-on-chip (EN)
DRTRM (EN)
Failure detection (EN)
System-on-chip (EN)
Deadlock detection (EN)
PAXOS (EN)
Consensus (EN)

Ελληνική γλώσσα
Αγγλική γλώσσα

Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Μικροϋπολογιστών και Ψηφιακών Συστημάτων VLSI (EL)

Αναφορά Δημιουργού 3.0 Ελλάδα
http://creativecommons.org/licenses/by/3.0/gr/




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.