Distributed machine learning framework on Akka

This item is provided by the institution :
Technical University of Crete   

Repository :
Institutional Repository Technical University of Crete   

see the original item page
in the repository's web site and access all digital files if the item*



Σύστημα κατανεμημένης μηχανικής μάθησης στην πλατφόρμα Akka (EL)
Distributed machine learning framework on Akka (EN)

Λαμπρινιδης Ιωαννης (EL)
Lamprinidis Ioannis (EN)

Δεληγιαννακης Αντωνιος (EL)
Σαμολαδας Βασιλης (EL)
Γιατρακος Νικολαος (EL)
Samoladas Vasilis (EN)
Deligiannakis Antonios (EN)
Giatrakos Nikolaos (EN)

bachelorThesis

2024


Η αυξανόμενη διάδοση των εφαρμογών που βασίζονται στα δεδομένα έχει οδηγήσει σε αυξανόμενη ζήτηση για αποτελεσματικούς και κλιμακωτούς αλγόριθμους μηχανικής μάθησης. Αυτή η διατριβή εμβαθύνει στο σχεδιασμό και την υλοποίηση ενός κατανεμημένου πυρήνα επικοινωνίας στο Akka για το σύστημα Online Machine Learning and Data Mining (OMLDM), ένα σύστημα που υποστηρίζει κατανεμημένη online μάθηση αξιοποιώντας την Parameter Server αρχιτεκτονική, για την ανάπτυξη Online Machine Learning pipelines σε πλατφόρμες ροής. Ο στόχος ήταν η υλοποίηση ενός αποτελεσματικού, κλιμακωτού, ανθεκτικού σε σφάλματα και ισχυρού πυρήνα για το OMLDM, η ανάλυση της επιβάρυνσης απόδοσης του Akka σε σύγκριση με μια τοπική υλοποίηση του πυρήνα του OMLDM που υλοποιήθηκε σε Java Threads και η αξιολόγηση της αύξησης της ταχύτητας απόδοσης που επιτυγχάνει ο πυρήνας σε ένα περιβάλλον cluster. Παρουσιάζεται μέσω πειραμάτων η επιβάρυνση επικοινωνίας που εισάγει το Akka και η απόδοση του πυρήνα σε τοπικά και clustered περιβάλλοντα. (EL)
The proliferation of data-driven applications has led to a growing demand for efficient and scalable machine learning algorithms. This thesis delves into the design and implementation of a distributed communication kernel in Akka for the Online Machine Learning and Data Mining system(OMLDM), a system that supports distributed online learning by utilizing the Parameter Server paradigm, for effortlessly deploying Online Machine Learning pipelines on streaming platforms. The objective was the implementation of an efficient, scalable, fault tolerant and robust kernel for the OMLDM, to analyze the performance overhead of Akka by comparing it to a local implementation of the OMLDM kernel, that utilizes Java Threads; To evaluate the performance speedup achieved by the kernel in a cluster environment. We demonstrate through experiments the communication overhead of Akka and the performance of the kernel in local and clustered environments. (EN)


Distributed systems (EN)

English

Πολυτεχνείο Κρήτης (EL)
Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών (EL)
Technical University of Crete (EN)




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)