Τεχνικές ψηφιακής επεξεργασίας εικόνας και βίντεο με εφαρμογή στην αναγνώριση συναισθηματικής κατάστασης

 
see the original item page
in the repository's web site and access all digital files if the item*
share



PhD thesis (EN)

2008 (EN)
Image and video processing techniques, with application to facial expressions recognition
Τεχνικές ψηφιακής επεξεργασίας εικόνας και βίντεο με εφαρμογή στην αναγνώριση συναισθηματικής κατάστασης

Κώτσια, Ειρήνη Σ.

Η διδακτορική διατριβή πραγματεύεται τεχνικές επεξεργασίας εικόνας και βίντεο για την αναγνώριση εκφράσεων προσώπου. Παρουσιάζεται μια νέα μέθοδος αναγνώρισης των έξι βασικών εκφράσεων προσώπου(θυμός, αηδία, φόβος, χαρά, λύπη και έκπληξη) σε πραγματικό χρόνο. Η κατηγοριοποίηση πετυχαίνεται χρησιμοποιώντας ένα σύστημα πρωτότυπων Μηχανών Εδράνων Διανυσμάτων [Support vector Machines (SVMs)]. Ακολούθως, προτείνεται μία νέα μέθοδος Διακριτής Ανάλυσης Μη Αρνητικών Πινάκων (Discriminant Non Negative Matrix factorization (DNMF)], η οποία χρησιμοποιεί προβεβλημένα διανύσματα κλίσεων (projected gradients) για να διασφαλέσει τη στασιμότητα του οριακού σημείου του προβλήματος βελτιστοποίησης. Για να επιτευχθεί και η αναγνώριση της ουδέτερης κατάστασης προτείνεται μια νέα μέθοδος, η οποία συνδυάζει πληροφοριών υφής και σχήματος, χρησιμοποιώντας ποικίλλες μεθόδους, όπως τα Νευρωνικά Δίκτυα Ακτινικών Συναρτήσεων Βάσης Μεσαίων και τα SVMs. Τέλος, παρουσιάζεται μια ανάλυση της επίδρασης της μερικής απόκρυψης (απόκρυψη περιοχής ματιών, στόματος) στην αναγνώριση έξι βασικών συναισθημάτων από ανθρώπινους παρατηρητές αλλά και από αρκετά συστήματα
The main field of interest of this thesis includes computational intelligence and image processing techniques in order to recognize facial expressions in images and video. More specifically, a new method for the real-time recognition of the six facial expressions (anger, disgust, fear, happiness, sadness and surprise) is proposed. The information taken under consideration consists of the coordinate differences extracted from the deformed grids calculated between the neutral state and the greatest facial expression intensity, as depicted in the video. The classification is achieved by using either a novel multi-class Support Vector Machines (SVMs) system for the direct recognition of facial expressions or many two-class SVMs systems for the recognition of facial expressions using the activated Facial Action Units (FAUs) that were detected. Moreover, a new Discriminant Non Negative Matrix Factorization (DNMF) method that uses projected gradients to ensure the stability of the limit point of the optimization problem, is proposed. The method is applied in facial expression recognition and frontal face verification problems. Furthermore, in order to achieve neutral state recognition, a new method that combines two sources of information (texture and shape) to achieve classification is presented. The fusion of the two kinds of information is performed using various methods, such as Median Radial Basis Function (MRBF) Neural Networks (NN) and SVMs, having as an input the outputs of the classification systems for each information source (texture and shape) and as an output the recognized facial expression or the set of the activated FAUs. The recognition of the neutral state makes the recognition of facial expressions in every video frame feasible. Finally, an analysis of the way partial occlusion affects the facial expression recognition is presented. More specifically, the effect of eyes or mouth occlusion on the recognition of the six basic facial expressions by human observers, experts or not, as well as by many facial expression recognition systems, is studied

PhD Thesis / Διδακτορική Διατριβή
info:eu-repo/semantics/doctoralThesis

Αναγνώριση προσώπου (Πληροφορική)
Facial expressions recognition
Μίξη πληροφορίας υφής και σχήματος
Texture and shape information fusion
Human face recognition (Computer science)
Support vector machines (SVMs)
Αναγνώριση εκφράσεων προσώπου
Image processing, Digital techniques
Μονάδες ενεργειών προσώπου
Διακριτή ανάλυση μη αρνητικών πινάκων
Partial occlusion of facial images
Μηχανές εδραίων διανυσμάτων
Επεξεργασία εικόνας, Ψηφιακές τεχνικές
Μερική απόκρυψη εικόνας προσώπου
Facial action units (FAUs)

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (EL)
Aristotle University of Thessaloniki (EN)

2008
2009-06-21T21:00:00Z


Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής

This record is part of 'IKEE', the Institutional Repository of Aristotle University of Thessaloniki's Library and Information Centre found at http://ikee.lib.auth.gr. Unless otherwise stated above, the record metadata were created by and belong to Aristotle University of Thessaloniki Library, Greece and are made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). Unless otherwise stated in the record, the content and copyright of files and fulltext documents belong to their respective authors. Out-of-copyright content that was digitized, converted, processed, modified, etc by AUTh Library, is made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). You are kindly requested to make a reference to AUTh Library and the URL of the record containing the resource whenever you make use of this material.
info:eu-repo/semantics/openAccess



*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)