Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
E-Locus Ιδρυματικό Καταθετήριο
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριοΝτετερμινιστική αναγνώριση αλλαγών υψηλού επιπέδου σε βάσεις γνώσεων RDF/S
Detecting deterministically high-level changes for RDF/S knowlefge bases

Παπαβασιλείου, Βασιλική
Papavasileiou, Vasiliki

Χριστοφίδης, Βασίλειος

Η γνώση είναι δυναμική και υπόκειται σε συνεχείς αλλαγές, που προκαλούνται από την δυναμικότητα του περιβάλλοντος, την ανακάλυψη ή αποκάλυψη νέας πληροφορίας και άλλες αιτίες. ΄Ενα τέτοιο δυναμικό σύστημα γνώσης είναι και ο Σημασιολογικός Ιστός, στον οποίο οι αντίστοιχοι φορείς γνώσης (οντολογίες και στιγμιότυπα οντολογιών) αλλάζουν, δημιουργώντας νέες εκδόσεις, συχνά χωρίς τον έλεγχο του διαχειριστή ή δημιουργού τους. Σε τέτοιες συνθήκες, είναι απαραίτητη η καταγραφή και αποθήκευση των διαφορών μεταξύ των εκδόσεων της οντολογίας (και των στιγμιοτύπων της), μία λειτουργικότητα η οποία επιτρέπει τον συγχρονισμό των διαφόρων εκδόσεων, την καταγραφή και τεκμηρίωση του εξελικτικού ιστορικού, την οπτικοποίηση των διαφορών μεταξύ των εκδόσεων, καθώς και την αποδοτική διακίνηση (μέσω δικτύου, σε κατανεμημένα περιβάλλοντα), αλλά και αποθήκευση των εκδόσεων (αφού η καταγραφή των διαφορών μεταξύ των εκδόσεων απαιτεί κατά κανόνα λιγότερο χώρο από την καταγραφή των ίδιων των εκδόσεων, άρα είναι αποδοτικότερη η αποθήκευση μίας έκδοσης και των διαφορών της με τις υπόλοιπες, παρά όλων των εκδόσεων ανεξάρτητα). Δυστυχώς, η καταγραφή των διαφορών με το χέρι είναι αδύνατη σε ορισμένες εφαρμογές (για παράδειγμα σε συνεργατικά ή κατανεμημένα περιβάλλοντα όπου δεν υπάρχει κεντρική διαχείριση των αλλαγών). Αλλά και όπου μια τέτοια καταγραφή είναι δυνατή, αυτή αποτελεί μια δύσκολη και επίπονη εργασία, η οποία οδηγεί συχνά σε λανθασμένες, ελλιπείς ή προβληματικές περιγραφές. Στην εργασία αυτή επικεντρωνόμαστε στην εκ των υστέρων καταγραφή των αλλαγών, δηλαδή στην ανίχνευση των αλλαγών μεταξύ δύο εκδόσεων, δοθέντων μόνο των δύο αυτών εκδόσεων. Η καταγραφή των διαφορών, γενικά, γίνεται διαμέσου γλωσσών περιγραφής διαφορών (ή αλλιώς γλωσσών περιγραφής αλλαγών), οι οποίες μπορεί να είναι χαμηλού ή υψηλού επιπέδου. Οι γλώσσες χαμηλού επιπέδου περιγράφουν τις αλλαγές σε συντακτικό επίπεδο, με υψηλό βαθμό λεπτομέρειας και είναι ευκολότερο να περιγραφούν και υλοποιηθούν. Αντίθετα, οι γλώσσες υψηλού επιπέδου παρέχουν περιγραφές αλλαγών σε υψηλότερο, σημασιολογικό-λογικό επίπεδο. Αυτό επιτυγχάνεται ομαδοποιώντας τις συντακτικές (χαμηλού επιπέδου) αλλαγές σε λογικές ενότητες (υψηλού επιπέδου αλλαγές). Με τον τρόπο αυτό, οι γλώσσες υψηλού επιπέδου προσφέρουν πιο συμπαγή αποθήκευση των αλλαγών, και επιτρέπουν μία πλησιέστερη προς την ανθρώπινη διαίσθηση περιγραφή της εξέλιξης των εκδόσεων, χωρίς απώλεια πληροφορίας. Από την άλλη, ο ορισμός, περιγραφή και υλοποίηση γλωσσών υψηλού επιπέδου είναι αρκετά δυσκολότερος. Στην εργασία αυτή ορίσαμε μία γλώσσα περιγραφής αλλαγών υψηλού επιπέδου, και αποδείξαμε ότι η γλώσσα αυτή ικανοποιεί μία σειρά από επιθυμητές ιδιότητες. Επιπλέον, περιγράψαμε έναν αποδοτικό αλγόριθμο ανίχνευσης αλλαγών μεταξύ εκδόσεων, ο οποίος βασίζεται στην εν λόγω γλώσσα. Τέλος, εξετάσαμε πειραματικά την ποιότητα της γλώσσας και του σχετικού αλγόριθμου εκτελώντας πειράματα πάνω σε διαφορετικές εκδόσεις των γνωστών οντολογιών GO και CIDOC, ώστε να διαπιστώσουμε και την πρακτική-διαισθητική αξία της προτεινόμενης γλώσσας. (EL)
Knowledge has a dynamic nature and changes constantly, either because the environment changes or because new information is encountered or obtained. The same holds for Semantic Web, that is a dynamic knowledge system where ontologies and instances of ontologies change creating new versions, often without the control of their editors or curators. In such a context, it is mandatory to record and store the differences of versions of an ontology (and their instances), as it allows us to synchronize different versions, to pertain an overview of the evolution history of the ontology, to visualize the differences between versions as well as to exchange (in distributed environments) and store efficiently versions since the deltas (i.e., the differences between a pair of versions) are more concise than the versions themselves. (Hence, it is more preferable to store one version and the subsequent deltas rather than all the versions). Unfortunately, the manual recording of changes is overruled in some usage scenarios (for example, in collaborative or distributed environments where no central authority exists). Nevertheless, when manual recording of changes is exercised it is often incomplete or erroneous. This Thesis focuses on the a-posteriori recording of differences between versions, that is the detection of changes between a pair of versions having as input only these two versions. The recording of changes is done generally through some language of changes. A language can either be low-level or high-level. Low-level languages describe syntactical differences, they arefine-grained and rather easy to define and implement. On the other hand, high-level languages describe differences on the semantical or logical level and are more difficult to define. They consist of high-level changes that group several syntactic (low-level) changes into logical entities. In this manner, high-level languages are more concise and more intuitive as they are closer to human perception and to the intentions of the editor or curator. The contribution of this Thesis lies in defining formally a language of high-level changes and proving that this language conforms to a set of desirable properties, implementing a sound and complete algorithm that efficiently detects the changes of the language and finally evaluating the quality of the language regarding its usefulness and intuitiveness as well as its corresponding algorithm by conducting experiments on real-world ontologies from the biological (Gene Ontology) and cultural (CIDOC Ontology) domain. (EN)

text
Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης

Υψηλού επιπέδου RDF/S Δέλτα
Αναγνώριση αλλαγών σε Οντολογίες
High-level RDF/S Deltas
Επιμελημένες Βάσεις Γνώσεων
Curated Knowledge Bases
Ontology Change Detection


Αγγλική γλώσσα

2009-12-04


Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.