Αυτόματη Αναγνώριση Ανθρώπινων Δράσεων χρησιμοποιώντας Βαθιά Συνελικτικά Νευρωνικά Δίκτυα

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Αυτόματη Αναγνώριση Ανθρώπινων Δράσεων χρησιμοποιώντας Βαθιά Συνελικτικά Νευρωνικά Δίκτυα (EL)

Νικολουδάκης, Ευάγγελος (EL)
Nikoloudakis, Efangelos (EL)

ntua (EL)
Μαραγκός, Πέτρος (EL)
Τζαφέστας, Κωνσταντίνος (EL)
Ποταμιάνος, Γεράσιμος (EL)

bachelorThesis

2017-07-18
2017-09-18T10:43:55Z
2017-09-18


Η παρούσα Διπλωματική Εργασία πραγματεύεται το πρόβλημα της αυτόματης αναγνώρισης ανθρώπινων δράσεων, στο πλαίσιο της αλληλεπίδρασης ανθρώπου-μηχανής. Για την εξαγωγή χαρακτηριστικών χρησιμοποιούνται τόσο hand-crafted τεχνικές όσο και τεχνικές βαθιάς μάθησης. Συγκεκριμένα, δίνεται έμφαση στην εφαρμογή των βελτιωμένων πυκνών τροχιών με Bag-of Words κωδικοποίηση καθώς και στην χρήση Τρισδιάστατων Συνελικτικών Νευρωνικών Δικτύων (3D ConvNets) και Συνελικτικών Νευρωνικών Δικτύων Διπλής Ροής (Two-Stream ConvNets), από τα οποία εξάγουμε χαρακτηριστικά βαθιάς μάθησης. Πειραματιζόμαστε χρησιμοποιώντας τις διαθέσιμες αναπαραστάσεις βίντεο, αξιολογώντας την επίδοση τους σε μία σειρά από δημοφιλείς βάσεις δεδομένων, καθώς και στη βάση ανθρώπινων δράσεων Cognimuse, η οποία δημιουργήθηκε στο ερευνητικό πλαίσιο της παρούσας εργασίας και παρουσιάζει ιδιαίτερες προκλήσεις. Για την ταξινόμηση των δράσεων χρησιμοποιούνται μη γραμμικές Μηχανές Διανυσμάτων Υποστήριξης με πυρήνα x^2, στο επίπεδο των οποίων εφαρμόζεται σύμμειξη των παραγόμενων αναπαράστασεων βίντεο, επιτυγχάνοντας state-of-the-art επίδοση στη βάση δεδομένων HMDB51 και πολύ υψηλή ακρίβεια αναγνώρισης στη βάση δεδομένων Hollywood2. (EL)


3Δ Συνελικτικά Νευρωνικά Δίκτυα (EL)
Μηχανές Διανυσμάτων Υποστήριξης (EL)
Αναγνώριση Ανθρώπινων Δράσεων (EL)
Αναγνώριση Ανθρώπινων Χειρονομιών (EL)
Συνελικτικά Νευρωνικά Δίκτυα Διπλής Ροής (EL)
Πυκνές Τροχιές (EL)
3D Convolutional Neural Networks (EN)
Two-Stream Convolutional Neural Networks (EN)
Dense Trajectories (EN)
Human Gesture Recognition (EN)
Support Vector Machines (EN)
Human Action Recognition (EN)

Ελληνική γλώσσα

Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής. Εργαστήριο Όρασης Υπολογιστών, Επικοινωνίας Λόγου και Επεξεργασίας Σημάτων (EL)

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
http://creativecommons.org/licenses/by-nc-nd/3.0/gr/




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.