Η παρούσα μεταπτυχιακή διατριβή έχει ως στόχο την ανάπτυξη μιας τεχνικής για την αποκατάσταση και ανάκτηση ψηφιακών εγγράφων από μια βάση. Αναλυτικότερα, η εν λόγω τεχνική αρχικά δέχεται μια εικόνα η οποία περιέχει το προς ανάκτηση έγγραφο. Στη συνέχεια, η εικόνα αυτή υπόκειται σε επεξεργασία προκειμένου να αποκοπεί το έγγραφο και να απορριφθεί ό,τι υπάρχει στο φόντο. Στα πλαίσια αυτής της διαδικασίας ακολουθείται μια ιεραρχική προσέγγιση για την σταδιακή απομόνωση της περιοχής στην οποία ανήκει το έγγραφο. Εφαρμόζεται η τεχνική ανίχνευσης προσώπου των Viola και Jones. Στη συνέχεια, πραγματοποιείται αποκοπή ενός μέρος του φόντου συνδυάζοντας τις τεχνικές δυαδικοποίησης του Otsu και του Sauvola. Ακολούθως, με τη χρήση του φίλτρου μεσαίας τιμής και ενός μεγάλου παραθύρου εξομαλύνονται τα χρώματα της εικόνας, ούτως ώστε η μέγιστη τιμή του ιστογράμματος να ανήκει στα εικονοστοιχεία του εγγράφου. Τέλος, με βάση αυτή την τιμή ελέγχονται από το κέντρο της εικόνας και προς τις τέσσερις κατευθύνσεις τα χρώματα των εικονοστοιχείων καθώς και μιας περιοχής πριν και μετά αυτών για να οριστούν οι τέσσερις πλευρές του εγγράφου. Από την καινούρια αυτή εικόνα απομακρύνεται ό,τι δε σχετίζεται με το κείμενο του εγγράφου ή άλλα ιδιαίτερα χαρακτηριστικά αυτού, όπως σφραγίδες ή υπογραφές, ούτως ώστε να μην επηρεάσουν τη διαδικασία της αναζήτησης που ακολουθεί. ΄Ετσι, διορθώνεται η κλίση του εγγράφου και επαναυπολογίζονται τα όριά του με βάση τη δυαδική μορφή του. Στο τελευταίο στάδιο της τεχνικής ανακτάται το έγγραφο που ταιριάζει περισσότερο με το έγγραφο ερώτημα καθώς και ένας αριθμός από άλλα παρόμοια έγγραφα από πλευράς μορφολογικών χαρακτηριστικών. Το διάνυσμα χαρακτηριστικών που χρησιμοποιείται για την ανάκτηση προκύπτει από τον υπολογισμό του μονοδιάστατου μετασχηματισμού συνημιτόνου για τις οριζόντιες προβολές των τεσσάρων περιστροφών του εγγράφου ανά 45◦ . Το όλο σύστημα μπορεί να χρησιμοποιηθεί σε υπηρεσίες όπου έχει γίνει ψηφιακή αποθήκευση εγγράφων, παραστατικών κ.λπ.
Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Ηλεκτρονικής και Τεχνολογίας Συστημάτων Πληροφορικής. Εργαστήριο Ηλεκτρικών Κυκλωμάτων, Επεξεργασίας Σήματος και Εικόνας