Μετατροπή διδιάστατων χαρτών σε αντίστοιχους τριών διαστάσεων κατάλληλους για χρήση σε εφαρμογές απτικής εικονικής πραγματικότητας για τυφλούς

Δείτε το αρχείο http://vivliothmmy.ee.auth.gr/141/  
Φορέας Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης
Συλλογή Καταθετήριο της Βιβλιοθήκης Ηλ. Μηχανικών και Μηχ. Υπολογιστών Μετατροπή διδιάστατων χαρτών σε αντίστοιχους τριών διαστάσεων κατάλληλους για χρήση σε εφαρμογές απτικής εικονικής πραγματικότητας για τυφλούς
Επιμέρους συλλογή Computer Science: Simulation of Systems
Θέματα Συστήματα πολυμέσων Προσομοίωση Συστημάτων Ειδικά Συστήματα
ΠεριγραφήΗ 3D αναπαράσταση συμβατικών πολιτικών χαρτών , προκειμένου να μετατραπεί η απεικονιζόμενη πληροφορία σε απτική και ηχητική μορφή ώστε να είναι αξιοποιήσιμη από άτομα με μερική ή ολική τύφλωση , απαιτεί ένα αρχικό στάδιο για τον καθορισμό των χαρακτηριστικών του εικονικού χάρτη. Συγκεκριμένα για την εφαρμογή μας : 1) Οι δρόμοι διαχωρίζονται από τα κτίρια χρησιμοποιώντας διαφορετικό ύψος για την τρισδιάστατη αναπαράσταση. 2) Κάθε όνομα πρέπει να βρίσκεται κατά το μεγαλύτερο τμήμα του εντόςτων ορίων της αντίστοιχης οδού. 3) Οι διασταυρώσεις αναγνωρίζονται χρησιμοποιώντας την αίσθηση της αφής. Η τρισδιάστατη αναπαράσταση του χάρτη συντίθεται αξιοποιώντας απλές διαδικασίες όπως μορφολογικά φίλτρα , τελευταίας τεχνολογίας αλγορίθμους για την επεξεργασία εικόνας , για την οπτική αναγνώριση χαρακτήρων Optical Character Recognition (OCR) καθώς και για την μετατροπή κειμένου σε ήχο Text To Speech (TTS) synthesis. Η εικόνα που ακολουθεί παρουσιάζει την αρχιτεκτονική του συστήματος όπως επίσης και τα ενδιάμεσα αποτελέσματα. Ως είσοδος στο σύστημα δίνεται η ψηφιακή εικόνα ενός συμβατικού πολιτικού χάρτη. Ως έξοδος λαμβάνεται η 3-D αναπαράσταση του τελευταίου παράλληλαμε την ταξινομημένη σε λίστα πληροφορία που αφορά τις ονομασίες των οδών. Όπως παρατηρούμε τα κτίρια σχεδιάζονται με μεγαλύτερο ύψος από ότι οι δρόμοι ώστε να είναιεφικτή η διάκρισή τους μέσω μίας συσκευής απτικής εικονικής πραγματικότητας. Το όνομα του εκάστοτε δρόμου αναπαράγεται όποτε ο χρήστης βρίσκεται σε αυτόν. Επιπρόσθετα ειδικά εφφέ όπως απτική αφή και τριβή χρησιμοποιούνται για τον διαχωρισμό σταυροδρομιών και κτιρίων όπως εκκλησίες κ.ά. από τα βασικά στοιχεία του αρχικού χάρτη όπως είναι οι δρόμοι. Συνοπτικά τα βήματα που ακολουθούνται είναι : Είσοδος: Στατική εικόνα του 2D χάρτη. Δημιουργία του 3D μοντέλου: A.1) Μορφολογικό φίλτρο 1: Εφαρμόζουμε το φίλτρο Dilate , κατωφλίωση(thresholding) και έναν αλγόριθμο dithering ώστε να διαχωρίσουμε τις οδούς από τα κτίρια. A.2) Αναδρομικά επιρεάζουμε το smoothness του χάρτη ώστε να αφαιρέσουμε τις πολύ μικρές περιοχές(Σχήμα a). A.3) Κατασκευή 3D μοντέλου (Σχήμα d). A.4) Αναγνωρίζουμε τις διασταυρώσεις και ειδικές περιοχές (π.χ. εκκλησίες κ.τ.λ.). Αναγνώριση των ονομασιών των οδών: A.5) Μορφολογικό φίλτρο 2: Εφαρμόζουμε το φίλτρο Erode και ελαττώνουμε το βάθος χρώματος (color depth) ώστε να διακρίνουμε τις περοχές τις αρχικής εικόνας που αναλογούν σε ονομασίες.(Σχήμα b). A.6) Εκτιμούμε την κατεύθυνση των ονομάτων των οδών βάση του αλγορίθμου Ελαχίστων Τετραγώνων (linear least-squares). Έπειτα συγκρίνουμε τις ονομασίες και τις κατευθύνσεις τους με τα αποτελέσματα του βήματος A.2. A.7) Διαγράφουμε όσα ονόματα δεν αναφέρονται σε κάποια οδό άρα δεν είναι και πραγματικά ονόματα. (Σχήμα c). A.8) Με τη χρήση κάποιας OCR εφαρμογής λαμβάνουμε το κείμενο των ονομάτων οδών που απέμειναν. Run-time: A.9) Ανίχνευση συγκρούσεων και απτικού |rendering. A.10) Προσομοιώνεται η απτική υφή του χάρτη. A.11) Τα ονόματα των οδών μετατρέπονται σε ήχο για την κατάλληλη πληροφόρηση του χρήστη και την εύκολη πλοήγησή του στην “ΕικονικήΠόλη”. The generation of a pseudo-3D representation of a conventional map in order to convert the encoded information into haptic-aural format so as to be perceivable by visually impaired people requires at an initial step to define the characteristics of the virtual map. For our case we define that: 1) Streets are separated from buildings using larger height for buildings in the 3D representation 2) Names should lie inside the corresponding street 3) Cross-roads are identified using haptic texturing The pseudo-3D map generation is constructed using simple operations like morphological filtering, state of the art algorithms for image processing and of-the-shelf systems for Optical Character Recognition (OCR) and Text To Speech (TTS) synthesis. Figure illustrates the architecture of the system as well as its intermediate results. The input to the system is a conventional 2D map. Theoutput is a pseudo-3D representation of the map with indexing information regarding the names of the roads, i.e. buildings are represented with larger height than streets so that the difference can be easily perceived through a haptic device. The name of each street is available and is reproduced whenever the user crosses it. Moreover, special effects like haptic texturing and friction are utilized to distinguish cross-roads and special buildings like churches, etc. from the main map components that are the streets and the major buildings. In the following, the steps of the algorithm are briefly described: I nput: Still image of the 2D map Generation of 3D model: A.1) Morphological filtering 1: Apply Dilate filter, thresholding and dithering to the input map so as to discriminate the streets from the major buildings. A.2) Recursively smooth the resulting map so as to delete fragmented small areas (Figure a). A.3) Generate the 3D model (Figure d). A.4) Identify cross-roads and special areas (e.g. churches, round-about, etc.). Street names recognition: A.5) Morphological filtering 2: Apply Erode filter , and decrease color depth to discriminate the image areas with street names fromthe rest of the map (Figure b). A.6) Estimate the direction of the street names using linear least-squares. Match the names and their directions with the segmented map of step A.2. A.7) Delete names that do not correspond to streets (Figure c). A.8) Perform OCR to the remaining street names. Duringrun-time: A.9) Collision detection and haptic rendering. A.10) Simulate haptic texturing and friction for the cross-roads and the special areas of A.4. A.11) Synthesize text from speech to provide aural feedback of the street names while the user navigates into the map using the haptic device. Output: 3D representation of the 2D map including information about the names of the street which is displayed using text to speech synthesis.
Δημιουργός Κωστόπουλος, Κωνσταντίνος
ΜεσολαβητήςΣτρίντζης Μιχαήλ-Γεράσιμος
Ημερομηνία2006-03-19
ΤύποςΔιπλωματική
Μορφότυποςapplication/pdf
Μορφότυποςvideo/x-msvideo
Πηγήhttp://vivliothmmy.ee.auth.gr/141/1/%CE%94%CE%99%CE%A0%CE%9B
%CE%A9%CE%9C%CE%91%CE%A4%CE%99%CE%9A%CE%97_%CE%95%CE%A1%CE%9
3%CE%91%CE%A3%CE%99%CE%91.pdf
Πηγήhttp://vivliothmmy.ee.auth.gr/141/2/Haptic_Map.avi
ΆδειαCreative Commons Attribution Non-Commercial No Derivatives
Βιβλιογραφική αναφοράΚωστόπουλος, Κωνσταντίνος (2006) Μετατροπή διδιάστατων χαρτών σε αντίστοιχους τριών διαστάσεων κατάλληλους για χρήση σε εφαρμογές απτικής εικονικής πραγματικότητας για τυφλούς. Στρίντζης Μιχαήλ-Γεράσιμος , Θεσσαλονίκη.
Σχέσηhttp://vivliothmmy.ee.auth.gr/141/
Επισκέψεις41