Τεχνικές μηχανικής όρασης για τον χαρακτηρισμό εικόνων προσώπου

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Computer vision techniques for facial image characterization
Τεχνικές μηχανικής όρασης για τον χαρακτηρισμό εικόνων προσώπου

Nikitidis, Symeon
Νικητίδης, Συμεών

PhD Thesis

2013


Το αντικείμενο το οποίο πραγματεύεται η διδακτορική αυτή διατριβή είναι ο χαρακτηρισμός εικόνων προσώπου, όπως είναι η αναγνώριση εκφράσεων, η αναγνώριση προσώπου, αλλά και η αναγνώριση της πόζας του. Στη μηχανική όραση ένα από τα πιο σημαντικά προβλήματα που καλείται να αντιμετωπίσει κάθε αλγόριθμος ανάλυσης εικόνων προσώπου, είναι η πολύ υψηλή διάσταση των δεδομένων εισόδου. Μια δημοφιλής κατηγορία μεθόδων για την αποδοτικότερη επεξεργασία αυτών, είναι οι μέθοδοι εκμάθησης υποχώρων οι οποίες στοχεύουν να ανακαλύψουν τα κρυμμένα χαρακτηριστικά των εικόνων, προκειμένου να εξάγουν κατάλληλες διακριτικές αναπαραστάσεις, των δεδομένων, μικρότερης διάστασης. Στη συνέχεια της διατριβής προτείνονται δύο διακριτικές μέθοδοι εκμάθησης υποχώρων, όπου η πρώτη τροποποιεί την συνάρτηση αποσύνθεσης της μεθόδου μη αρνητικής παραγοντοποίησης πινάκων εισάγοντας κατάλληλους διακριτικούς περιορισμούς εμπνευσμένους από τη διακριτική ανάλυση υποκλάσεων, ενώ η δεύτερη χρησιμοποιεί τυχαία χαρακτηριστικά, αντί για τα αρχικά διανύσματα χαρακτηριστικών υψηλής διάστασης, προκειμένου να προσδιορίσει έναν κατάλληλο υποχώρο προβολής χαμηλής διάστασης στον οποίο το περιθώριο μεταξύ των προβεβλημένων δειγμάτων διαφορετικών κλάσεων μεγιστοποιείται. Πειραματικά αποτελέσματα για τα προβλήματα της αναγνώρισης προσώπου, αλλά και της έκφρασής του, σε διάφορα δημοφιλή σύνολα δεδομένων, έδειξαν ότι οι προτεινόμενοι αλγόριθμοι μπορούν να επιτύχουν εξαιρετική μείωση της διάστασης των δεδομένων, αλλά και υψηλότερη απόδοση αναγνώρισης σε σχέση με πολλές ανταγωνιστικές μεθόδους μείωσης διάστασης που έχουν προταθεί στη βιβλιογραφία. Επίσης, στη συνέχεια της διατριβής, μελετάται η επαυξητική εκπαίδευση των μηχανών εδραίων διανυσμάτων πολλών κλάσεων και παρουσιάζεται ένας αλγόριθμος εκπαίδευσής τους, ο οποίος αξιοποιώντας τη βέλτιστη λύση που υπολογίστηκε προγενέστερα αλλά και πρωτότυπους πολλαπλασιαστικούς κανόνες ανανέωσης, προσφέρει μειωμένο υπολογιστικό κόστος για την προσαρμογή του κατηγοριοποιητή στα νέα δεδομένα εκπαίδευσης σε σχέση με τη συμβατική προσέγγιση μαζικής εκπαίδευσης από την αρχή. Ο προτεινόμενος αλγόριθμος εφαρμόστηκε σε διάφορα σύνολα δεδομένων αλλά και στο πρόβλημα της αναγνώρισης της πόζας προσώπου.
The main field of interest of this thesis is the characterization of facial images, such as facial expression recognition, face recognition and facial pose recognition. One of the most crucial issues that every facial image analysis algorithm in computer vision encounters is the high dimensionality of the provided image data. A popular category of methods that obtain a more manageable problem is the subspace image representation algorithms, which aim to discover the latent image features by projecting the high dimensional input data to a low dimensional subspace. In this thesis two subspace learning methods are presented, that aim to enhance classes discrimination in the projection subspace. The first method modifies the cost function of the original Nonnegative Matrix Factorization algorithm by incorporating appropriate discriminant factors inspired by Clustering Discriminant Analysis, while the second operates on the random features instead of the actual high dimensional input data and derives an optimal projection matrix, such that the separating margin between the projected samples of different classes is maximized. Experimental results for face recognition and facial expression recognition on various popular datasets shown that the developed algorithms exploiting the discriminant low dimensional facial image representations achieved superior recognition performance compared against various competing algorithms. Subsequently, an algorithm for the incremental training of multiclass support vector machines is presented, which exploits a set of novel multiplicative update rules and a warm start optimization framework, in order to achieve computational efficiency, when the training data collection is sequentially enriched and dynamic adaptation of the classifier is required. Experimental results on various data collections and for facial pose recognition, verified that the developed method is faster than retraining the classifier from scratch, while the achieved classification accuracy rate is maintained at the same level.

Φυσικές Επιστήμες ➨ Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική

Computer vision
Suibspace learning
Facial expression recognition
Face recognition
Facial pose recognition
Αναγνώριση πόζας προσώπου
Αναγνώριση εκφράσεων προσώπου
Computer and Information Sciences
Αναγνώριση προσώπου
Φυσικές Επιστήμες
Εκμάθηση υποχώρων
Μηχανική όραση
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Natural Sciences

Ελληνική γλώσσα

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ)
Aristotle University Of Thessaloniki (AUTH)

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.