Η παρούσα διατριβή έχει ως αντικείμενο μελέτης τις ψηφιακές αρχιτεκτονικές και
την οργάνωση επεξεργαστών, που οδηγούν σε αποδοτική εκτέλεση εντολών και
διευκολύνουν τον παραλληλισμό εφαρμογών. Αρχικά παρουσιάζεται ένας
διαμορφώσιμος πολυεπεξεργαστής σε Σύστημα-σε-Ολοκληρωμένο, που επιταχύνει την
εκτέλεση των κωδικοποιητών MPEG-2 και MPEG-4 εφαρμόζοντας παραλληλισμό σε
επίπεδο νημάτων. Η βελτίωση της απόδοσης των κωδικοποιήσεων φαίνεται από τη
σημαντική μείωση του δυναμικού αριθμού εντολών που εκτελούνται σε κάθε
περίπτωση. Στη συνέχεια μελετάται η σχεδίαση αρχιτεκτονικών Ταχύ
Μετασχηματισμού Fourier για 4Κ, 16Κ, 64Κ και 256Κ μιγαδικά σημεία. Οι
αρχιτεκτονικές αυτές βασίζονται στη χρήση μιας πρωτότυπης μηχανής βάσης-43 και
έχουν υλοποιηθεί σε FPGA και VLSI, επιτυγχάνοντας σημαντικά υψηλές συχνότητες
λειτουργίας και μεγάλες ρυθμαποδόσεις. Η σύγκριση των χαρακτηριστικών και της
απόδοσης του κυκλώματος 4Κ FFT με αντίστοιχες αρχιτεκτονικές της βιβλιογραφίας
καταδεικνύει την αποδοτικότητα και τα πλεονεκτήματα της προτεινόμενης μεθόδου
υλοποίησης κυκλωμάτων FFT. Το τελευταίο μέρος της διατριβής παρουσιάζει έναν
πολλαπλασιαστή κινητής υποδιαστολής πολλαπλής ακρίβειας και τρείς μονάδες
Συγχωνευμένου Πολλαπλασιασμού-Πρόσθεσης. Το προτεινόμενα σχέδια υποστηρίζουν
πολλαπλά μορφότυπα ακρίβειας της ΙΕΕΕ και πραγματοποιούν, για διάφορες
ακρίβειες, είτε παράλληλες πράξεις μεμονωμένων πολλαπλασιασμών και προσθέσεων ή
παράλληλες εκτελέσεις της εντολής (AxB + C).
(EL)
This dissertation focuses on the study of digital architectures and processors
organization, leading to the efficient instruction execution, while enhancing
the parallelization of applications. First, we present a configurable
System-on-Chip multiprocessor, for speeding up MPEG-2 and MPEG-4 encoding, by
using thread-level parallelism. Improving the performance of the MPEG encoders
is shown by reducing the dynamic instruction count at multiple processor
contexts. Next, we present the design and implementation of FFT architectures
for 4K, 16K, 64K and 256K complex points, which are based on utilizing a novel
radix-43 engine. The architectures have been implemented both on FPGAs and
VLSI, achieving significantly high operating frequencies and throughput.
Comparing the main characteristics and the performance of the 4K FFT
architecture, with existing solutions in the literature, we prove the
efficiency and the advantages of the proposed solution for implementing FFT
architectures. Finally, the last part of the thesis presents a multiple
precision floating-point multiplier and three floating-point Fused Multiply-Add
architectures. The proposed designs can accommodate multiple IEEE precision
formats, and perform parallel operations of stand-alone multiplications and
additions, or execute in parallel multiple single instruction equations (AxB +
C).
(EN)