Ταξινόμηση και μεταφορά τεχνοτροπίας (στυλ) κινουμένων σχεδίων με χρήση βαθέων νευρωνικών δικτύων

This item is provided by the institution :
University of West Attica   

Repository :
Institutional Repository Polynoe   

see the original item page
in the repository's web site and access all digital files if the item*



Ταξινόμηση και μεταφορά τεχνοτροπίας (στυλ) κινουμένων σχεδίων με χρήση βαθέων νευρωνικών δικτύων

Χατζηλίας, Κωνσταντίνος

Tselenti, Panagiota
Σχολή Μηχανικών
Βουλόδημος, Αθανάσιος
Μπαρδής, Γεώργιος
Τμήμα Μηχανικών Πληροφορικής και Υπολογιστών

Διπλωματική εργασία

2021-07

2021-07-21T13:54:45Z


Η αναγνώριση και η ταξινόμηση εικόνας είναι οι δύο πιο συχνές περιπτώσεις χρήσης των CNN στον τομέα της Μηχανικής Μάθησης. Πηγαίνοντας ένα βήμα παραπέρα, η ανίχνευση και ταξινόμηση διαφορετικών στυλ, καθώς και η μεταφορά ενός στυλ, από μια εικόνα σε μια άλλη είναι μια ακόμα ενδιαφέρουσα εφαρμογή των CNN. Ο στόχος είναι η δημιουργία ενός μοντέλου το οποίο, λαμβάνοντας υπόψη αρκετές εικόνες διαφορετικών στυλ (είτε πρόκειται για διαφορετικά στυλ τέχνης, στυλ κινούμενων σχεδίων κλπ), αναγνωρίζει, διαφοροποιεί και προβλέπει με ακρίβεια το στυλ μιας εικόνας. Για το δεύτερο μέρος, χρησιμοποιώντας τμήματα ενός μοντέλου, μπορεί κανείς να αναγνωρίσει και να μεταφέρει τα χαρακτηριστικά ενός συγκεκριμένου στυλ σε μια εικόνα διαφορετικού στυλ. Σε αυτή τη διπλωματική εργασία, προσπαθούμε να κάνουμε τη διάκριση μεταξύ των Δυτικών και Ανατολικών στυλ κινουμένων σχεδίων (συχνά αναφέρονται ως “cartoon” και “anime” αντίστοιχα). Αυτό χωρίζεται σε δυο μέρη. Το πρώτο μέρος είναι η αναγνώριση και η ταξινόμηση στυλ, όπου προσπαθούμε να ταξινομήσουμε την κατηγορία μιας εικόνας και το δεύτερο μέρος είναι η μεταφορά στυλ, όπου προσπαθούμε να μεταφέρουμε τα χαρακτηριστικά του ενός στυλ σε μια εικόνα του άλλου. Για να το πετύχουμε αυτό, δημιουργούμε και αξιολογούμε μερικά μοντέλα CNN, με διαφορετικές αρχιτεκτονικές και διαφορετικά επίπεδα πολυπλοκότητας στην αρχιτεκτονική τους, και συγκρίνουμε την απόδοση και τα αποτελέσματά τους. Πιο συγκεκριμένα, για το κομμάτι της αναγνώρισης και ταξινόμησης, δημιουργήσαμε 3 διαφορετικά μοντέλα, ένα VGG16 μοντέλο, ένα VGG19 μοντέλο και ένα μοντέλο CNN με 4 συνελικτικά επίπεδα, τα οποία εκπαιδεύσαμε, αξιολογήσαμε και συγκρίναμε τις επιδόσεις και τα αποτελέσματά τους. Για το κομμάτι της μεταφοράς στυλ, δημιουργήσαμε ένα VGG19 μοντέλο και χρησιμοποιώντας συγκεκριμένα στρώματα, τα οποία περιέχουν την πληροφορία που μας ενδιαφέρει, μεταφέραμε τα χαρακτηριστικά στυλ από μια εικόνα σε μια άλλη.


Ταξινόμηση
Deep learning
Style transfer
CNN
Βαθιά μάθηση
Convolutional neural network
Μηχανική μάθηση
Μεταφορά στυλ
Machine learning
Classification
VGG
Συνελικτικά νευρωνικά δίκτυα

Greek

Πανεπιστήμιο Δυτικής Αττικής

ΣΧΟΛΗ ΜΗΧΑΝΙΚΩΝ - Τμήμα Μηχανικών Πληροφορικής και Υπολογιστών - Διπλωματικές εργασίες

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές
http://creativecommons.org/licenses/by-nc-nd/4.0/
Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)