Αρχιτεκτονικές και οργάνωση επεξεργαστών για αποδοτικό παραλληλισμό εφαρμογών

This item is provided by the institution :
/aggregator-openarchives/portal/institutions/uoa   

Repository :
Pergamos Digital Library   

see the original item page
in the repository's web site and access all digital files if the item*



Αρχιτεκτονικές και οργάνωση επεξεργαστών για αποδοτικό παραλληλισμό εφαρμογών

Μανωλόπουλος Κωνσταντίνος (EL)

born_digital_thesis
Διδακτορική Διατριβή (EL)
Doctoral Dissertation (EN)

2013


Η παρούσα διατριβή έχει ως αντικείμενο μελέτης τις ψηφιακές αρχιτεκτονικές και την οργάνωση επεξεργαστών, που οδηγούν σε αποδοτική εκτέλεση εντολών και διευκολύνουν τον παραλληλισμό εφαρμογών. Αρχικά παρουσιάζεται ένας διαμορφώσιμος πολυεπεξεργαστής σε Σύστημα-σε-Ολοκληρωμένο, που επιταχύνει την εκτέλεση των κωδικοποιητών MPEG-2 και MPEG-4 εφαρμόζοντας παραλληλισμό σε επίπεδο νημάτων. Η βελτίωση της απόδοσης των κωδικοποιήσεων φαίνεται από τη σημαντική μείωση του δυναμικού αριθμού εντολών που εκτελούνται σε κάθε περίπτωση. Στη συνέχεια μελετάται η σχεδίαση αρχιτεκτονικών Ταχύ Μετασχηματισμού Fourier για 4Κ, 16Κ, 64Κ και 256Κ μιγαδικά σημεία. Οι αρχιτεκτονικές αυτές βασίζονται στη χρήση μιας πρωτότυπης μηχανής βάσης-43 και έχουν υλοποιηθεί σε FPGA και VLSI, επιτυγχάνοντας σημαντικά υψηλές συχνότητες λειτουργίας και μεγάλες ρυθμαποδόσεις. Η σύγκριση των χαρακτηριστικών και της απόδοσης του κυκλώματος 4Κ FFT με αντίστοιχες αρχιτεκτονικές της βιβλιογραφίας καταδεικνύει την αποδοτικότητα και τα πλεονεκτήματα της προτεινόμενης μεθόδου υλοποίησης κυκλωμάτων FFT. Το τελευταίο μέρος της διατριβής παρουσιάζει έναν πολλαπλασιαστή κινητής υποδιαστολής πολλαπλής ακρίβειας και τρείς μονάδες Συγχωνευμένου Πολλαπλασιασμού-Πρόσθεσης. Το προτεινόμενα σχέδια υποστηρίζουν πολλαπλά μορφότυπα ακρίβειας της ΙΕΕΕ και πραγματοποιούν, για διάφορες ακρίβειες, είτε παράλληλες πράξεις μεμονωμένων πολλαπλασιασμών και προσθέσεων ή παράλληλες εκτελέσεις της εντολής (AxB + C). (EL)
This dissertation focuses on the study of digital architectures and processors organization, leading to the efficient instruction execution, while enhancing the parallelization of applications. First, we present a configurable System-on-Chip multiprocessor, for speeding up MPEG-2 and MPEG-4 encoding, by using thread-level parallelism. Improving the performance of the MPEG encoders is shown by reducing the dynamic instruction count at multiple processor contexts. Next, we present the design and implementation of FFT architectures for 4K, 16K, 64K and 256K complex points, which are based on utilizing a novel radix-43 engine. The architectures have been implemented both on FPGAs and VLSI, achieving significantly high operating frequencies and throughput. Comparing the main characteristics and the performance of the 4K FFT architecture, with existing solutions in the literature, we prove the efficiency and the advantages of the proposed solution for implementing FFT architectures. Finally, the last part of the thesis presents a multiple precision floating-point multiplier and three floating-point Fused Multiply-Add architectures. The proposed designs can accommodate multiple IEEE precision formats, and perform parallel operations of stand-alone multiplications and additions, or execute in parallel multiple single instruction equations (AxB + C). (EN)


Greek

Βιβλιοθήκη και Κέντρο Πληροφόρησης » Βιβλιοθήκη Σχολής Θετικών Επιστημών
Σχολή Θετικών Επιστημών » Τμήμα Φυσικής » Τομέας Ηλεκτρονικής Φυσικής και Συστημάτων

https://creativecommons.org/licenses/by-nc/4.0/




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)