Πρόβλεψη χρόνου επικοινωνίας παράλληλων εφαρμογών με τεχνικές μηχανικής μάθησης

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Πρόβλεψη χρόνου επικοινωνίας παράλληλων εφαρμογών με τεχνικές μηχανικής μάθησης (EL)
Prediction of communication time of large-scale applications using machine learning techniques (EN)

Αποστολάκης, Σωτήριος (EL)
Apostolakis, Sotirios (EN)

ntua (EL)
Γκούμας, Γεώργιος (EL)
Σταφυλοπάτης, Ανδρέας-Γεώργιος (EL)
Κοζύρης, Νεκτάριος (EL)

bachelorThesis

2016-04-12T08:16:22Z
2015-07-22
2016-04-12


Ο χρόνος επικοινωνίας είναι ένα αναπόσπαστο κομμάτι του συνολικού χρόνου εκτέλεσης εφαρμογών μεγάλης κλίμακας και εξαρτάται από ένα ευρύ φάσμα παραγόντων, συμπεριλαμβανομένων της αρχιτεκτονικής και του λογισμικού του συστήματος, τα χαρακτηριστικά της εφαρμογής και δυσνόητα δικτυακά φαινόμενα. Η πρόβλεψη του κόστους επικοινωνίας είναι ένα ζήτημα που έχει μελετηθεί από πολλούς από διάφορες οπτικές γωνίες. Με τη δουλειά μας αποσκοπούμε να συνεισφέρουμε σε αυτή την προσπάθεια και να παρουσιάσουμε μία πρωτοποριακή προσέγγιση αυτού του θέματος. Προτείνουμε μία machine learning μεθοδολογία για την πρόβλεψη του συνολικού χρόνου επικοινωνίας παράλληλων εφαρμογών. Ορίσαμε ένα σύνολο από παραμέτρους, προερχόμενες από τα χαρακτηριστικά της εφαρμογής, το μέγεθος των χρησιμοποιούμενων πόρων, την αντιστοίχηση των διεργασιών στους πυρήνες του συστήματος και την αρχιτεκτονική του δικτύου. Κατόπιν, συγκεντρώνοντας μετρήσεις, που καλύπτουν όλο το φάσμα των χρησιμοποιούμενων παραμέτρων, με την εκτέλεση μιας απλής γενικευμένης εφαρμογής, αποκτήσαμε μία εικόνα της συμπεριφοράς του υπό εξέταση δικτύου. Ο αλγόριθμος forests of extremely randomized trees χρησιμοποιήθηκε για να προβλέψουμε τον χρόνο επικοινωνίας στηριζόμενοι στα δεδομένα επικοινωνίας που συλλέξαμε με την προηγούμενη διαδικασία. Το μοντέλο πρόβλεψης μας πετυχαίνει αξιοσημείωτα αποτελέσματα στην πρόβλεψη επίδοσης δύο διαφορετικών εφαρμογών για ποικίλα μεγέθη προβλήματος και ρυθμίσεις συστήματος. Επίσης, διαλέγουμε επιτυχώς τις βέλτιστες ρυθμίσεις εκτέλεσης σε ένα σενάριο λήψης αποφάσεων. Τέλος, πέρα από τις προβλέψεις, η δουλειά μας πετυχαίνει να αναγνωρίσει τα αίτια της διαφοροποίησης της επίδοσης σε δύο αρκετά διαφορετικά δίκτυα μεγάλης κλίμακας. (EL)
Communication time is an integral part of the execution time of large-scale applications and depends on a wide set of factors, including system architecture and software, application's features and obscure network effects. Its prediction is a subject which was studied by many from various perspectives. With our work, we wish to contribute and add a novel approach to this matter. We propose a machine-learning scheme to predict the total communication time of parallel applications. We define a set of features extracted from application's characteristics, allocation size, process mapping and system's architecture, and devise a simple benchmark which sweeps over the parameter space and provides valuable insight on the network effects. Forests of extremely randomized trees - a supervised learning algorithm - is applied to perform regression analysis on communication data, derived from the benchmark, and application execution time. Our prediction model achieves noteworthy results in making predictions for two different communication kernels with various problem sizes and system configurations, and successfully selects optimal execution configurations in a decision-making scenario. Finally, except for making predictions, our work succeeded in identifying the culprits behind performance variability for two dissimilar network architectures. (EN)


Πρόβλεψη επίδοσης (EL)
Χρόνος επικοινωνίας (EL)
Μηχανική μάθηση (EL)
Machine learning (EN)
Performance prediction (EN)
Communication time (EN)

Ελληνική γλώσσα
Αγγλική γλώσσα

Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Υπολογιστικών Συστημάτων (EL)
Computing Systems lab (EL)

Default License




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.