Ταξινόμηση και μεταφορά τεχνοτροπίας (στυλ) κινουμένων σχεδίων με χρήση βαθέων νευρωνικών δικτύων

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Ταξινόμηση και μεταφορά τεχνοτροπίας (στυλ) κινουμένων σχεδίων με χρήση βαθέων νευρωνικών δικτύων

Χατζηλίας, Κωνσταντίνος

Tselenti, Panagiota
Σχολή Μηχανικών
Βουλόδημος, Αθανάσιος
Μπαρδής, Γεώργιος
Τμήμα Μηχανικών Πληροφορικής και Υπολογιστών

Διπλωματική εργασία

2021-07

2021-07-21T13:54:45Z


Η αναγνώριση και η ταξινόμηση εικόνας είναι οι δύο πιο συχνές περιπτώσεις χρήσης των CNN στον τομέα της Μηχανικής Μάθησης. Πηγαίνοντας ένα βήμα παραπέρα, η ανίχνευση και ταξινόμηση διαφορετικών στυλ, καθώς και η μεταφορά ενός στυλ, από μια εικόνα σε μια άλλη είναι μια ακόμα ενδιαφέρουσα εφαρμογή των CNN. Ο στόχος είναι η δημιουργία ενός μοντέλου το οποίο, λαμβάνοντας υπόψη αρκετές εικόνες διαφορετικών στυλ (είτε πρόκειται για διαφορετικά στυλ τέχνης, στυλ κινούμενων σχεδίων κλπ), αναγνωρίζει, διαφοροποιεί και προβλέπει με ακρίβεια το στυλ μιας εικόνας. Για το δεύτερο μέρος, χρησιμοποιώντας τμήματα ενός μοντέλου, μπορεί κανείς να αναγνωρίσει και να μεταφέρει τα χαρακτηριστικά ενός συγκεκριμένου στυλ σε μια εικόνα διαφορετικού στυλ. Σε αυτή τη διπλωματική εργασία, προσπαθούμε να κάνουμε τη διάκριση μεταξύ των Δυτικών και Ανατολικών στυλ κινουμένων σχεδίων (συχνά αναφέρονται ως “cartoon” και “anime” αντίστοιχα). Αυτό χωρίζεται σε δυο μέρη. Το πρώτο μέρος είναι η αναγνώριση και η ταξινόμηση στυλ, όπου προσπαθούμε να ταξινομήσουμε την κατηγορία μιας εικόνας και το δεύτερο μέρος είναι η μεταφορά στυλ, όπου προσπαθούμε να μεταφέρουμε τα χαρακτηριστικά του ενός στυλ σε μια εικόνα του άλλου. Για να το πετύχουμε αυτό, δημιουργούμε και αξιολογούμε μερικά μοντέλα CNN, με διαφορετικές αρχιτεκτονικές και διαφορετικά επίπεδα πολυπλοκότητας στην αρχιτεκτονική τους, και συγκρίνουμε την απόδοση και τα αποτελέσματά τους. Πιο συγκεκριμένα, για το κομμάτι της αναγνώρισης και ταξινόμησης, δημιουργήσαμε 3 διαφορετικά μοντέλα, ένα VGG16 μοντέλο, ένα VGG19 μοντέλο και ένα μοντέλο CNN με 4 συνελικτικά επίπεδα, τα οποία εκπαιδεύσαμε, αξιολογήσαμε και συγκρίναμε τις επιδόσεις και τα αποτελέσματά τους. Για το κομμάτι της μεταφοράς στυλ, δημιουργήσαμε ένα VGG19 μοντέλο και χρησιμοποιώντας συγκεκριμένα στρώματα, τα οποία περιέχουν την πληροφορία που μας ενδιαφέρει, μεταφέραμε τα χαρακτηριστικά στυλ από μια εικόνα σε μια άλλη.


Ταξινόμηση
Deep learning
Style transfer
CNN
Βαθιά μάθηση
Convolutional neural network
Μηχανική μάθηση
Μεταφορά στυλ
Machine learning
Classification
VGG
Συνελικτικά νευρωνικά δίκτυα

Ελληνική γλώσσα

Πανεπιστήμιο Δυτικής Αττικής

ΣΧΟΛΗ ΜΗΧΑΝΙΚΩΝ - Τμήμα Μηχανικών Πληροφορικής και Υπολογιστών - Διπλωματικές εργασίες

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές
http://creativecommons.org/licenses/by-nc-nd/4.0/
Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.