Διαχείριση κανόνων αντιστοιχίσεων για ολοκλήρωση πληροφοριών με οντολογίες

RDF 

 
This item is provided by the institution :
University of Crete
Repository :
E-Locus Institutional Repository
see the original item page
in the repository's web site and access all digital files if the item*
share



Semantic enrichment/homogenization by EKT
2016 (EN)
Mappings management for ontology - based integration
Διαχείριση κανόνων αντιστοιχίσεων για ολοκλήρωση πληροφοριών με οντολογίες

Ανυφαντής, Νικόλαος Σ.

Doerr, Martin
Τζίτζικας, Ιωάννης
Πλεξουσάκης, Δημήτριος

Ο Σημασιολογικός Ιστός (ΣΙ) είναι μια εξελισσόμενη επέκταση του Παγκόσμιου Ιστού στην οποία το περιεχόμενο μπορεί να εκφραστεί όχι μόνο με φυσική γλώσσα αλλά και με τυπικές γλώσσες (π.χ. RDF / S ) που επιτρέπουν την παροχή προηγμένων υπηρεσιών αναζήτησης, δια μοιρασμού και ολοκλήρωσης πληροφορίας. Στις τεχνολογίες αυτές εδράζεται η τάση για δημοσίευση περιεχομένου βάσει των αρχών των Διασυνδεδεμένων Δεδομένων. Δυσ τυχώς, το μεγαλύτερο μέρος του περιεχομένου που βρίσκεται στο διαδίκτυο βασίζεται σε τεχνολογίες πο υ δεν ανταποκρίν ον ται στις αρχές του Σημασιολογικού Ιστού. Η πλειοψηφία των δεδομένων που είναι διαθέσιμα είναι σε μορφή σχεσιακών , object - oriented και NoSQL βάσ εων δεδομένων . Για το λόγο αυτό έχουν αναπτυχθεί διάφορα εργαλεία και συστήματα τα οποία αναλαμβάνουν την μετατροπή αυτού του περιεχομένου σε συνδεδεμένα δεδομένα. Κάθε σύστημα ακολουθεί μια δική του μέθοδο, καθώς αξίζει να σημειωθεί και η γλώσσα συσχετίσεων R2RML που προτείν εται από το W3C ως επίσημη γλώσσα για την έκφραση αντιστοιχίσεων από σχεσιακές βάσεις δεδομένων σε RDF σύνολα δεδομένων. Στην ε ργασία αυτή επικεντρωνόμαστε στην X3ML , μια γλώσσα αντιστοιχήσεων που σχεδιάστηκε από το Ι νστιτούτο Πληροφορικής του ΙΤΕ , η οποία είναι αναγνώσιμη από τον άνθρωπο, αρκετά γενική ώστε να καλύπτει τα περισσότερα μοντέλα δεδομένων που χρησιμοποιούνται στις μέρες μας και πιο εκφραστική ως προς τη διαδικασία δημιουργίας URI. Ο κύριος στόχος αυτής της μεταπτυχιακής εργασίας είναι η παροχή λειτουργιών για τη διαχείριση αντιστοιχήσεων εκφρασμένες στη γλώσσα X 3 ML . Αρχικά εντοπί σαμε τις κύριες περιπτώσεις χρήσης ( business use cases ) , συγκεκριμένα τις α) Δημιουργία μιας αντιστοίχισης , κατά την οποία ο χρήστης θέλει να δημιουργήσ ει μια αντιστοίχηση από την αρχή , και β) Βελτίωση μια ς αντιστοίχισης κατά την οποία ο χρήστης επιθυμεί να βελτιώσει μια υπάρχουσα αντιστοίχιση , να ελέγ ξει την ποιότητά της, να τη συγκρίν ει με άλλες και να παρακολουθ εί την εξέλιξή της. Βάσει αυτών ορίσαμε τις απαιτήσεις του συστήματος και εν συνεχεία σχεδιάσαμε και υλοποιήσαμε 11 βασικές λειτουργίες. Οι λειτουργίες αυτές αφορούν στην ανάλυση των σχημάτων που εμπλέκονται σε μία αντιστοίχηση, σ τον υπολογισμό ποσοστ ών κάλυψης, στη γρ αφική απεικόνιση και σύγκριση αντιστοιχίσεων , και στην παρακολούθηση της εξέλιξης τους . Συγκεκριμένα, η ανάλυση σχημάτων προσφέρει την δυνατότητα να περιηγηθ ούμε και να καταλάβουμε καλύτερα το περιεχόμενό τους. Τα ποσοστά κάλυψης παρέχουν μια συνολική εικ όνα των στοιχείων που έχουν χρησιμοποιηθεί ενώ υπάρχει και η δυνατότητα εξαίρεσης των στοιχείων που θεωρούνται ανεπιθύμητα για μία αντιστοίχηση. Λειτουργίες γραφικής αναπαράστασης προσφέρονται για την οπτικοποίηση μιας αντιστοίχησης με έμφαση στα συντακτικ ά στοιχεία της γλώσσας , και επίσης παρέχεται μια τρισδιάστατη αλληλεπιδραστική αναπαράσταση . Όσον αφορά τη σύγκριση , λειτουργίες όπως κειμενική σύγκριση των αντίστοιχων XML αναπαραστάσεων , οπτικοποίηση της διαφοράς με γράφο και σύγκριση παραγόμενων στιγμιότυπων είναι εφικτές . Τέλος, η λειτουργία της παρακολούθησης της εξέλιξης βοηθάει το χρήστη να εντοπίσει τα σημεία που έχουν αλλάξει κατά την πάροδο του χρόνου. Συνοψίζοντας, η καινοτομία έγκειται στον διαδραστικό χαρακτήρα όλων των λειτουργιών και στην τρισδιάστατη απεικόνιση των αντιστοιχίσεων , καθιστώντας την παρούσα εργασία την πρώτη μελέτη εκτεταμένη ς διαχείριση ς αντιστοιχίσεων στο συγκεκριμένο τομέα . (EL)
The Semantic Web (SW) is an evolving extension of the World Wide Web in which the content can be expressed not only in natural language, but also in formal languages (e.g. RDF/S) that can be read and used by software agents, permitting them to find, share and integrate information more easily. S emantic Web technologies form the foundation for publishing data according to t he principles of Linked Data. Unf ortunately, most web content is based on technologies that do not meet the principles of the Semantic Web. T he majority of the data is available in relational , object - oriented and NoSQL databases . For this reason several sy stems have been developed for converting and publishing content as linked data. Ε ach system follows its own method , while it is worth noting the R2RML mapping language proposed by W3C as an official language for expressing mappings from relational database s in RDF datasets . In this work we focus on X3ML language ; a mapping formalism designed by the Institute of Computer Science of FORTH, which is human readable, generic enough to cover most of the data models used nowadays and more explicit with the URI g enerating process. The main objective of this MSc thesis is to provide a complete analysis of mappings expressed in X3ML language. First ly, we identify the main business use cases, a) Create a Mapping in which the actor wants to generate a mapping from sc ratch, b) Improve a Mapping in which the actor needs to improve it, check its quality, compare with others and monitor its evolution. Based on these, we defined the system requirements and then design ed and implement ed 11 basic functionalities . These funct ion alities refer to the analysis of the schema s involved in a particular mapping , the calculation of coverage metrics , the graphical representation and comparison of mappings , and the monitor ing of their evolution. More s pecifically, the analysis of schemas offers the opportunity o f navigat ing and better understand ing the content. The coverage metrics give an overview of the mapped data and allow excluding elements that are considered undesirable for a mapping . For the g raphical representation , we introduce functionalities that visualize a mapping , focusing on syntactic elements of the language, and provide a three - dimensional interactive representation. As regards comparisons, several function alities are offered such as textual comparison of mappings in XML format , representation of difference s through graph and compari son of generated instances . Finally, the functionality of tracking the evolution of a mapping helps the user to identify the basic points that have changed over time. All in all , the main novelty of this work is the interactivity of all functionalities and 3D visualization of mappings. (EN)

text

Date intergration
Ολοκλήρωση δεδομένων
Schema coverages
Μετρήσεις σχημάτων

Πανεπιστήμιο Κρήτης (EL)
University of Crete (EN)

2016-03-18




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)