Ανίχνευση Προσώπων Βασισμένη σε Συνελικτικά Νευρωνικά Δίκτυα

RDF 

 
Το τεκμήριο παρέχεται από τον φορέα :
Πανεπιστήμιο Κρήτης
Αποθετήριο :
E-Locus Ιδρυματικό Καταθετήριο
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο



Σημασιολογικός εμπλουτισμός/ομογενοποίηση από το EKT
2003 (EL)
Face Detection Based on Convolutional Neural Networks
Ανίχνευση Προσώπων Βασισμένη σε Συνελικτικά Νευρωνικά Δίκτυα

Δελάκης, Μανόλης (EL)
Delakis, Manolis (EN)

Η ανίχνευση ανθρώπινων προσώπων αν και επιτελείται στιγμιαία, αβίαστα και με ενδεικτική ακρίβεια από τον ανθρώπινο εγκέφαλο, για την έρευνα της υπολογιστικής όρασης είναι ακόμα ένα θέμα υπό ανάπτυξη. Επιπρόσθετα, το μεγάλο εύρος πρακτικών εφαρμογών της όπως η αυτόματη προετοιμασία δεδομένων για την αναγνώριση προσώπου, η ανάκτηση εικόνας με βάση το περιεχόμενο ή η προχωρημένη αλληλεπίδραση μεταξύ ανθρώπου και μηχανής, την καθιστούν ως ένα πρόβλημα με θεωρητική αλλά κκαι πρακτική αξία. Ο σκοπός της παρούσας εργασίας ήταν η εισαγωγή των Συνελικτικών Νευρωνικών Δικτύων σαν ένας αποτελεσματικός και ταχύς ανιχνευτής προσώπων, ικανός να λειτουργεί σε μη ελεγχόμενα περιβάλλοντα και χωρίς καμία προεπεξεργασία. Μια συνελικτική νευρωνική τοπολογία προτείνεται, σχεδιασμένη ώστε να είναι σθεναρή σε μεταβλητές συνθήκες εικόνας και έκφρασης προσώπου ή σε άλλες δυνατές παραμορφώσεις της εισόδου. Το δίκτυο εκπαιδεύτηκε με ένα αρκετά μεγάλο σύνολο εκπαίδευσης, άμεσα προερχόμενο από φυσικά δεδομένα, μέσω του αλγορίθμου backpropagation. Χρησιμοποιώντας τα εκπαιδευμένα φίλτρα του δικτύου, επινοήθηκε μια γρήγορη διαδικασία για τη σάρωση της εικόνας, βασισμένη ολοκληρωτικά σε απλές λειτουργίες επεξεργασίας εικόνας. Το σύστημα δοκιμάστηκε σε μια σειρά από μεγάλα και δύσκολα σύνολα δοκιμής, επιδεικνύοντας πολύ υψηλά ποσοστά ανίχνευσης με λίγες και σποραδικές εσφαλμένες ειδοποιήσεις. Η σύγκριση με τα τρέχοντα πρότυπα συστήματα σε κοινά αναφερόμενα σύνολα απεκάλυψε ότι το προτεινόμενο σύστημα είναι ο καλύτερης απόδοσης ανιχνευτής προσώπων γενικής χρήσης της βιβλιογραφίας. Επιπλέον, η ανοχή του δικτύου σε μια σειρά από δυνατές παραμορφώσεις της εισόδου μετρήθηκε παι επιβεβαιώθηκε σε πειράματα ανάλυσης της ευαισθησίας. (EL)
Human face detection even though is performed instantly, effortlessly and with indicative accuracy by the human brain, for machine vision research is a matter still under development. Moreover, its wide range of applications like automatic data preparation for face recognition, content-based image retrieval or advanced human and computer interaction, make it a problem with both theoretical and practical values. The aim of this study was to introduce Convolutional Neural Networks as an efficient and fast face detector, able to operate in un-controlled image environments and without preprocessing. A convolutional neural topology is proposed, designed to be robust in varying image conditions and facial expression or other input deformations. The network was trained over a large enough training set of face patterns, coming directly from natural data, via the backpropagation algorithm. Using the trained convolutional filters of the network, a fast procedure for image scanning and face localization was devised, based purely on basic image processing operations. The system was tested in a series of large and difficult test sets exhibiting very high detection rates with a few and sporadic false alarms. The comparison with the current stateof- the-art systems in common benchmark sets revealed that the proposed system is the best performing general-purposed face detector of the reported literature. Furthermore, the tolerance of the network in a series of possible input deformations was measured and verified in conducted sensitivity analysis experiments. (EN)

text

Πανεπιστήμιο Κρήτης (EL)
University of Crete (EN)

2003-07-01
2003-12-10




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.