Υλοποίηση multi-GPU L3 BLAS βιβλιοθήκης με POSIX Threads και HIP

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Υλοποίηση multi-GPU L3 BLAS βιβλιοθήκης με POSIX Threads και HIP (EL)

Πούτας, Σωκράτης (EL)
Poutas, Sokratis (EN)

ntua (EL)
Γκούμας, Γεώργιος (EL)
Κοζύρης, Νεκτάριος (EL)
Πνευματικάτος, Διονύσιος (EL)

bachelorThesis

2024-01-29T08:28:00Z
2023-09-14


Σκοπός της παρούσας διπλωματικής εργασίας είναι η εξερεύνηση διαφορετικών υλοποιήσεων μιας βιβλιοθήκης δρομολόγησης υπο-προβλημάτων γραμμικής άλγεβρας σε συστήματα με πολλαπλούς επεξεργαστές γραφικών (multi-GPU BLAS), στοχεύοντας στην επιτάχυνση που προσφέρει η επικάλυψη του υπολογισμού σε GPU και της μεταφοράς δεδομένων μεταξύ CPU και GPU. Αυτό επιτυγχάνεται μέσω ουρών εργασιών και ενός συστήματος συγχρονισμού με βάση γεγονότα (events). Οι προηγούμενες εκδόσεις της βιβλιοθήκης χρησιμοποιούσαν CUDA, κάτι που την καθιστούσε λειτουργική μόνο σε συστήματα με Nvidia GPUs. Σε αυτή την εργασία υλοποιούμε δύο νέες εκδόσεις της βιβλιοθήκης: μία βασισμένη στα POSIX threads και μία που χρησιμοποιεί το HIP. Τέλος, συγκρίνουμε τις προγραμματιστικές δυνατότητες κάθε υλοποίησης και τις επιπτώσεις τους στην επίδοση της βιβλιοθήκης, συμπεραίνοντας ότι οι δικές μας υλοποιήσεις επεκτείνουν τις δυνατότητες εφαρμογής της βιβλιοθήκης και επιτυγχάνουν παρόμοιες ή καλύτερες επιδόσεις. (EL)
This thesis explores different library implementations for routing linear algebra sub-problems in multi-GPU systems, with the aim of achieving speedup through overlapping CPU-GPU communication with GPU computation. This is accomplished through task queues and an event-based synchronization system. The previous versions of the library utilized a CUDA back-end, limiting its functionality to Nvidia systems. In this thesis, we implement two new versions of the library: one based on POSIX threads and another that uses HIP. We then compare the programming capabilities of each implementation and their impact on library performance, concluding that our implementation extends the applicability of the library and achieves similar or superior performance. (EN)


Επεξεργαστές γραφικών (EL)
Ουρές εργασιών (EL)
Γεγονότα (EL)
Παράλληλη εκτέλεση (EL)
Γραμμική άλγεβρα (EL)
CUDA (EN)
Multi-GPU BLAS (EN)
Pthreads (EN)
GPU (EN)
HIP (EN)

Ελληνική γλώσσα

Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Υπολογιστικών Συστημάτων (EL)

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
http://creativecommons.org/licenses/by-nc-nd/3.0/gr/




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.