Ανάπτυξη και υλοποίηση τεχνικής για την αποκατάσταση και ανάκτηση εγγράφων

Το τεκμήριο παρέχεται από τον φορέα :
Δημοκρίτειο Πανεπιστήμιο Θράκης   

Αποθετήριο :
Αποθετήριο Δημοκρίτειου Πανεπιστημίου   

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Ανάπτυξη και υλοποίηση τεχνικής για την αποκατάσταση και ανάκτηση εγγράφων

Ntonti, Maria
Ντόντη, Μαρία

Πρατικάκης, Ιωάννης
Pratikakis, Ioannis
Παπαμάρκος, Νικόλαος
Mitianoudis, Nikolaos
Μητιανούδης, Νικόλαος
Papamarkos, Nikos

masterThesis

2018-03-20
2023-07-06T08:32:10Z


Βιβλιογραφία: σ. 65-66
Η παρούσα μεταπτυχιακή διατριβή έχει ως στόχο την ανάπτυξη μιας τεχνικής για την αποκατάσταση και ανάκτηση ψηφιακών εγγράφων από μια βάση. Αναλυτικότερα, η εν λόγω τεχνική αρχικά δέχεται μια εικόνα η οποία περιέχει το προς ανάκτηση έγγραφο. Στη συνέχεια, η εικόνα αυτή υπόκειται σε επεξεργασία προκειμένου να αποκοπεί το έγγραφο και να απορριφθεί ό,τι υπάρχει στο φόντο. Στα πλαίσια αυτής της διαδικασίας ακολουθείται μια ιεραρχική προσέγγιση για την σταδιακή απομόνωση της περιοχής στην οποία ανήκει το έγγραφο. Εφαρμόζεται η τεχνική ανίχνευσης προσώπου των Viola και Jones. Στη συνέχεια, πραγματοποιείται αποκοπή ενός μέρος του φόντου συνδυάζοντας τις τεχνικές δυαδικοποίησης του Otsu και του Sauvola. Ακολούθως, με τη χρήση του φίλτρου μεσαίας τιμής και ενός μεγάλου παραθύρου εξομαλύνονται τα χρώματα της εικόνας, ούτως ώστε η μέγιστη τιμή του ιστογράμματος να ανήκει στα εικονοστοιχεία του εγγράφου. Τέλος, με βάση αυτή την τιμή ελέγχονται από το κέντρο της εικόνας και προς τις τέσσερις κατευθύνσεις τα χρώματα των εικονοστοιχείων καθώς και μιας περιοχής πριν και μετά αυτών για να οριστούν οι τέσσερις πλευρές του εγγράφου. Από την καινούρια αυτή εικόνα απομακρύνεται ό,τι δε σχετίζεται με το κείμενο του εγγράφου ή άλλα ιδιαίτερα χαρακτηριστικά αυτού, όπως σφραγίδες ή υπογραφές, ούτως ώστε να μην επηρεάσουν τη διαδικασία της αναζήτησης που ακολουθεί. ΄Ετσι, διορθώνεται η κλίση του εγγράφου και επαναυπολογίζονται τα όριά του με βάση τη δυαδική μορφή του. Στο τελευταίο στάδιο της τεχνικής ανακτάται το έγγραφο που ταιριάζει περισσότερο με το έγγραφο ερώτημα καθώς και ένας αριθμός από άλλα παρόμοια έγγραφα από πλευράς μορφολογικών χαρακτηριστικών. Το διάνυσμα χαρακτηριστικών που χρησιμοποιείται για την ανάκτηση προκύπτει από τον υπολογισμό του μονοδιάστατου μετασχηματισμού συνημιτόνου για τις οριζόντιες προβολές των τεσσάρων περιστροφών του εγγράφου ανά 45◦ . Το όλο σύστημα μπορεί να χρησιμοποιηθεί σε υπηρεσίες όπου έχει γίνει ψηφιακή αποθήκευση εγγράφων, παραστατικών κ.λπ.
66 σ.


Optical Character Recognition
Image segmentation
Image processing--Digital techniques
Ψηφιακή επεξεργασία εικόνας
Οπτική αναγνώριση χαρακτήρων
Τμηματοποίηση εικόνας
Digital image processing
OCR

Ελληνική γλώσσα

Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Ηλεκτρονικής και Τεχνολογίας Συστημάτων Πληροφορικής. Εργαστήριο Ηλεκτρικών Κυκλωμάτων, Επεξεργασίας Σήματος και Εικόνας
duth


http://creativecommons.org/licenses/by-nc-nd/3.0/us/
Attribution-NonCommercial-NoDerivs 3.0 United States
free




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.