Ανίχνευση κακόβουλου λογισμικού μέσω μηχανικής μάθησης: αρχιτεκτονική διπλής εισόδου

 
Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
Ιδρυματικό Αποθετήριο Πολυτεχνείου Κρήτης
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2020 (EL)

Ανίχνευση κακόβουλου λογισμικού μέσω μηχανικής μάθησης: αρχιτεκτονική διπλής εισόδου (EL)
Malware detection using machine learning: a double input architecture (EN)

Μπελλωνιας Παναγιωτης (EL)
Bellonias Panagiotis (EN)

Λαγουδακης Μιχαηλ (EL)
Μπλετσας Αγγελος (EL)
Πολυτεχνείο Κρήτης (EL)
Bletsas Aggelos (EN)
Technical University of Crete (EN)
Lagoudakis Michail (EN)
Κάτος, Βασίλειος Αν (EN)

Αυτή η εργασία αξιολογεί την αποδοτικότητα ενός μοντέλου μηχανικής μάθησης με διπλή είσοδο για τον εντοπισμό κακόβουλου λογισμικού. Το μοντέλο που υλοποιήθηκε συγκρίνεται με άλλες δύο αρχιτεκτονικές νευρωνικών δικτύων για να εκτιμηθεί η αποτελεσματικότητά του. Το πρώτο νευρωνικό χρησιμοποιεί το εκτελέσιμο αρχείο σε μορφή εικόνας σαν είσοδο ενώ το δεύτερο εκμεταλλεύεται χαρακτηριστικά από τις κεφαλίδες του δείγματος. Το προτεινόμενο νευρωνικό δίκτυο, χρησιμοποιώντας και τις δύο μορφές πληροφορίας σαν είσοδο, έφερε καλύτερα αποτελέσματα σε σχέση με τα υπόλοιπα σημειώνοντας εμβαδό κάτω από την καμπύλη ίσο με 0.989. Επιπλέον, έγιναν πειράματα σύγκρισης της αρχιτεκτονικής με σύγχρονες εμπορικές λύσεις για τον εντοπισμό κακόβουλου λογισμικού, παρόλο που η εκπαίδευση έγινε με σχετικά περιορισμένα δεδομένα. Το προτεινόμενο νευρωνικό δίκτυο της εργασίας σημείωσε το τρίτο καλύτερο ποσοστό αληθώς θετικών δειγμάτων ίσο με 0.972. Με τη διπλωματική περιλαμβάνονται όλα τα εργαλεία και δεδομένα που απαιτούνται για την αναπαραγωγή του προτεινόμενου μοντέλου αλλά και των παραγόμενων αποτελεσμάτων. Η σημασία της διαθεσιμότητας των δεδομένων δεν μπορεί να αμεληθεί. (EL)
This dissertation evaluates the effectiveness of a double input architecture of a machine learning model on malware detection. The model developed is compared to two different neural network architectures to highlight its effectiveness. The first one uses an image representation of the executable file as an input and the second one utilizes only features from the headers of the file. The implemented neural network, using both inputs, outperformed its contestants with an area under receiver operating characteristic (ROC) curve (AUC) equal to 0.989. Furthermore, state-of-the-art antivirus products were compared to the proposed architecture, even though the latter was trained with a relatively limited dataset. The proposed neural network of this work was placed third with a True Positive Rate of 0.972. Complete sources are provided for reproducing the proposed model and the derived results. The importance of large dataset availability in such domains should not be overlooked. (EN)

bachelorThesis

Κακόβουλο Λογισμικό (EL)
Κυβερνοασφάλεια (EL)
Μηχανική μάθηση (EL)
Machine learning (EN)
Malware (EN)
Cyber security (EN)


Αγγλική γλώσσα

2020


Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών (EL)
Technical University of Crete::School of Electrical and Computer Engineering (EN)




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.