Νευρωνικά Δίκτυα Βαθειάς Μάθησης για Ανάλυση Ψηϕιακών Μέσων

 
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2015 (EL)
Νευρωνικά Δίκτυα Βαθειάς Μάθησης για Ανάλυση Ψηϕιακών Μέσων

Γαλανόπουλος, Δαμιανός Λεωνίδα

Η αναγνώριση κίνησης (action recognition) με τη χρήση οπτικής πληροφορίας είναι μία εξαιρετικά ενεργή περιοχή έρευνας στην επιστήμη της πληροφορικής και πιο συγκεκριμένα στον τομέα της Μηχανικής Μάθησης. Έχοντας πολλές εφαρμογές σε τομείς όπως η έξυπνη επιτήρηση (smart surveillance), η βιομετρία ή και η ρομποτική με έμφαση στην αλληλεπίδραση ανθρώπου-υπολογιστή. Παράλληλα τα τελευταία χρόνια υπάρχει μεγάλο επιστημονικό ενδιαφέρον στον τομέα της επονομαζόμενης Βαθειάς Μάθησης (Deep Learning), κυρίως λόγο των υψηλών αποδόσεων στον τομέα της Μηχανικής Όρασης και της Ανάλυσης Πολυμεσικού Περιεχομένου. Στη παρούσα εργασία προτείνουμε μία μέθοδο για την επίλυση του προβλήματος της αναγνώρισης ανθρώπινης κίνησης η οποία βασίζεται σε τεχνικές Βαθειάς Μάθησης, όπως η κωδικοποίηση βίντεο μέσω Βαθιών Autoencoders και στη κατηγοριοποίηση με Τεχνητά Νευρωνικά Δίκτυα και Μηχανές Διανυσμάτων Υποστήριξης. Η μέθοδος που παρουσιάζεται είναι ανεξάρτητη από τη γωνία λήψης του αντικειμένου (view invariant), κάτι το οποίο είναι πολύ σημαντικό για προβλήματα πραγματικού κόσμου. Η μέθοδος προσπαθεί να κωδικοποιήσει την πληροφορία κίνησης η οποία υπάρχει μέσα σ'ένα καρέ με σκοπό να απλοποιηθεί το πρόβλημα της μετέπειτα κατηγοριοποίησης.
Action Recognition from visual content is a highly active research field in Computer Science and more particular in Machine Learning area. This field is applied in many areas such as smart surveillance, biometrics, and robotics by emphasize in human-computer interaction. Recently research community is focus in Deep Learning techniques and application, due to state-of-the-art results in Computer Vision and Multimedia Analysis fields. In this work a new method for human action recognition is proposed. This method is based in Deep Learning techniques such as Autoencoders and Neural Networks Classifiers. The proposed method is view invariant which is a very important for ``real-world'' problems. We try to encode the temporal information in a video in order to simplify the problem for the subsequent classification.

info:eu-repo/semantics/masterThesis
Postgraduate Thesis / Μεταπτυχιακή Εργασία

Deep Learning Neural Networks
Αναγνώριση Κίνησης
Action Recognition
AutoEncoders
Αυτοκωδικοποιητές
Βαθειά Μάθηση Νευρωνικά Δίκτυα

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (EL)
Aristotle University of Thessaloniki (EN)

Ελληνική γλώσσα

2015
info:eu-repo/date/embargoEnd/2018-03-01
2016-10-19T08:16:04Z


Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής

This record is part of 'IKEE', the Institutional Repository of Aristotle University of Thessaloniki's Library and Information Centre found at http://ikee.lib.auth.gr. Unless otherwise stated above, the record metadata were created by and belong to Aristotle University of Thessaloniki Library, Greece and are made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). Unless otherwise stated in the record, the content and copyright of files and fulltext documents belong to their respective authors. Out-of-copyright content that was digitized, converted, processed, modified, etc by AUTh Library, is made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). You are kindly requested to make a reference to AUTh Library and the URL of the record containing the resource whenever you make use of this material.
info:eu-repo/semantics/embargoedAccess



*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.