Αντιληπτικώς Σχετικοί Μηχανισμοί για την Περιγραφή και Ανάκληση της Οπτικής Πληροφορίας

This item is provided by the institution :
University of Crete   

Repository :
E-Locus Institutional Repository   

see the original item page
in the repository's web site and access all digital files if the item*



Perceptually Relevant Mechanisms for the Description and Retrieval of Visual Information
Αντιληπτικώς Σχετικοί Μηχανισμοί για την Περιγραφή και Ανάκληση της Οπτικής Πληροφορίας

Ζαμπούλης, Ξενοφών

Ορφανουδάκης, Στέλιος, 1948-2005

Τύπος Εργασίας--Διδακτορικές διατριβές
text

2002-03-01


Στη διατριβή αυτή, μηχανισμοί περιγραφής και ανάκλησης της οπτικής πληροφορίας, σχετικοί με την αντίληψη, παρουσιάζονται και συζητώνται. Ο στόχος είναι η εξαγωγή περιγραφών της οπτικής πληροφορίας οι οποίες είναι συμβατές με την ανθρώπινη αντίληψη και μπορούν να χρησιμοποιηθούν σε επερωτήσεις με βάση το περιεχόμενο προκειμένου να ληφθούν απαντήσεις οι οποίες εκτιμώνται καλύτερα από τους τελικούς χρήστες. Οι προτεινόμενοι μηχανισμοί αφορούν την περιγραφή των πρωτογενών οπτικών γνωρισμάτων καθώς και των χωρικών τους διευθετήσεων και δίδουν έμφαση στην αναπαράσταση αυτής της πληροφορίας σε συνάρτηση με την κλίμακα παρατήρησης. Η, εξαρτώμενη από την κλίμακα παρατήρησης, αναπαράσταση χρησιμοποείται στη συνέχεια στην εξαγωγή περιοχών της εικόνας οι οποίες παρουσιάζουν χαρακτηριστικές διευθετήσεις γνωρισμάτων και στην αναγνώριση κυρίαρχων και παραγώμενων από την κλίση της εικόνας δομικών στοιχείων, για τα οποία είναι γνωστή η περιγραφική τους σημασία ως συνιστωσών του οπτικού περιεχομένου. Η αντιληπτική οργάνωση κυρίαρχων δομικών στοιχείων σε αντιληπτικά σύνολα αποδίδει μια επιπρόσθετη συνιστώσα του οπτικού περιεχομένου. Γνωρίσματα όπως τα αντιληπτικά σύνολα ολοκληρώνονται στη συνέχεια με πληροφορία περί των χωρικών διευθετήσεων των πρωτογενών οπτικών γνωρισμάτων και χρησιμοποιούνται στην περιγραφή και ανάκληση της οπτικής πληροφορίας. Συγκεκριμένα, μια μέθοδος, εμπνευσμένη από την φυσιολογία της όρασης, παρουσιάζεται για την αναπαράσταση πρωτογενών οπτικών γνωρισμάτων βασισμένη στην σύνοψη κλιμάκων του οπτικού περιεχομένου. Η αναπαράσταση σύνοψης κλιμάκων μπορεί να υπολογισθεί παράλληλα και επιδεικνύει υπολογιστικές και περιγραφικές ιδιότητες οι οποίες επεκτείνουν τον πρότυπο ορισμό της οπτικής πληροφορίας με βάση την κλίμακα. Επιπρόσθετα, μια μέθοδος προτείνεται για την αναπαράσταση σε πολλαπλές κλίμακες των χωρικών διευθετήσεων πρωτογενών οπτικών γνωρισμάτων. Η αναπαράσταση βασίζεται σε τοπικούς περιγραφείς και χρησιμοποιείται για την περιγραφή, ταξινόμηση και την αναλοίωτη, σε σχέση με την κλίμακα, αναπαράσταση τέτοιων διευθετήσεων. Κατά αυτόν τον τρόπο, η εμπεριεχόμενη πληροφορία χρησιμοποιείται επίσης για την αναδίφηση και ανάκληση παρόμοιου οπτικού περιεχομένου. Τέλος, η προτεινόμενη μέθοδος είναι γενική, όσον αφορά το ότι μπορεί να χρησιμοποιηθεί με διαφορετικούς τοπικούς περιγραφείς, και η απορρέουσα αναπαράσταση των χωρικών διευθετήσεων των γνωρισμάτων έχει μειωμένες απαιτήσεις σε μνήμη. Σε συνάρτηση με τη συνιστώσα του οπτικού περιεχομένου η οποία απορρέει από τη διεργασία της αντιληπτικής οργάνωσης, μια προσέγγιση παρουσιάζεται για την περιγραφή μιας συγκεκριμένης κλάσης αντιληπτικών συνόλων, συγκεκριμένα αυτής των περιγραμμάτων, χρησιμοποιώντας μια μέθοδο βασισμένη στην καμπυλότητα η οποία ανιχνέυει αντιληπτικώς-σχετικά και υπολογιστικώς-σταθερά σημεία πάνω στα περιγράμματα. Τα σημεία αυτά χρησιμοποιούνται στη συνέχεια για τον αντιληπτικώς σχετικό τεμαχισμό των περιγραμμάτων, ο οποίος με τη σειρά του χρησιμοποιείται για το σκοπό της αντιστοίχησης περιγραμμάτων με βάση την ομοιότητα. Η ολοκληρωμένη χρήση πληροφορίας περί των χωρικών διευθετήσεων των πρωτογενών οπτικών γνωρισμάτων και των αντιληπτικών συνόλων από κυρίαρχα δομικά στοιχεία επιδεικνύεται και αποτελέσματα από αντιπροσωπευτικά πειράματα παρουσιάζονται και συζητώνται. (EL)
In this dissertation, mechanisms for the perceptually-relevant description and retrieval of visual information are presented and discussed. The goal is to derive descriptions of visual information that are compatible with human perception and can be used in queries by content to yield responses that are better appreciated by end users. The proposed mechanisms concern the description of primitive visual features and spatial arrangements of such features, and emphasize the representation of this information with respect to scale of observation. This scale dependent representation is subsequently used to extract image regions with a characteristic spatial arrangement of features and identify gradient-derived dominant structural elements, which are both known to be significant descriptive components of visual content. The perceptual organization of dominant structural elements into perceptual groups yields an additional component of visual content. Attributes of such perceptual groups are then integrated with information about spatial arrangements of primitive visual features and used in the description and retrieval of visual information. In particular, a physiology-inspired method is presented for the representation of primitive visual features based on the scale-summarization of visual content. The scale-summary representation can be computed in parallel and exhibits computational and descriptive properties that extend the standard definition of visual information with respect to scale. In addition, a method is proposed for the multiscale representation of spatial arrangements of primitive visual features. This representation is based on local descriptors and is utilized for the description, classification, and scale-invariant representation of such arrangements. Thus, the information it contains is also used for the browsing and retrieval of visually similar content. Finally, the proposed method is generic, in that it can be used with different local descriptors, and the resulting representation of spatial feature distributions has reduced memory requirements. In this dissertation, mechanisms for the perceptually-relevant description and retrieval of visual information are presented and discussed. The goal is to derive descriptions of visual information that are compatible with human perception and can be used in queries by content to yield responses that are better appreciated by end users. The proposed mechanisms concern the description of primitive visual features and spatial arrangements of such features, and emphasize the representation of this information with respect to scale of observation. This scale dependent representation is subsequently used to extract image regions with a characteristic spatial arrangement of features and identify gradient-derived dominant structural elements, which are both known to be significant descriptive components of visual content. The perceptual organization of dominant structural elements into perceptual groups yields an additional component of visual content. Attributes of such perceptual groups are then integrated with information about spatial arrangements of primitive visual features and used in the description and retrieval of visual information. In particular, a physiology-inspired method is presented for the representation of primitive visual features based on the scale-summarization of visual content. The scale-summary representation can be computed in parallel and exhibits computational and descriptive properties that extend the standard definition of visual information with respect to scale. In addition, a method is proposed for the multiscale representation of spatial arrangements of primitive visual features. This representation is based on local descriptors and is utilized for the description, classification, and scale-invariant representation of such arrangements. Thus, the information it contains is also used for the browsing and retrieval of visually similar content. Finally, the proposed method is generic, in that it can be used with different local descriptors, and the resulting representation of spatial feature distributions has reduced memory requirements. With respect to the component of visual content resulting from the process of perceptual organization, an approach is presented for the description of a certain class of perceptual groups, namely that of image contours, using a curvature-based method that detects perceptually-significant and computationally-stable contour points. These points are then used for the perceptually-relevant piecewise decomposition of contours, which in turn is used for the purpose of contour similarity matching. The integrated use of information about spatial arrangements of primitive visual features and perceptual groups of dominant structure elements is demonstrated and results of representative experiments are presented and discussed. With respect to the component of visual content resulting from the process of perceptual organization, an approach is presented for the description of a certain class of perceptual groups, namely that of image contours, using a curvature-based method that detects perceptually-significant and computationally-stable contour points. These points are then used for the perceptually-relevant piecewise decomposition of contours, which in turn is used for the purpose of contour similarity matching. The integrated use of information about spatial arrangements of primitive visual features and perceptual groups of dominant structure elements is demonstrated and results of representative experiments are presented and discussed. (EN)


English





*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)