PhD thesis (EN)

2010 (EN)
Εξέλιξη οντολογιών σε συστήματα ολοκλήρωσης πληροφοριών
Ontology evolution in data integration

Κονδυλάκης, Χαρίδημος Γεωργίου
Kondylakis, Haridimos G

Πλεξουσάκης, Δημήτρης

Λόγω της ταχείας επιστημονικής ανάπτυξης, οι οντολογίες και τα σχήματα που χρησιμοποιούνται για να μοντελοποιήσουν την επιστημονική γνώση πρέπει να αλλάζουν. Όταν οι οντολογίες εξελίσσονται, οι αλλαγές θα πρέπει με κάποιο τρόπο να ενσωματωθούν και να χρησιμοποιηθούν από τα προ-υπάρχοντα συστήματα ολοκλήρωσης πληροφοριών. Στα περισσότερα από τα συστήματα αυτά, όταν οι οντολογίες αλλάζουν, οι συσχετίσεις τους με τις πηγές των δεδομένων δημιουργούνται από το μηδέν χειρονακτικά, μια διαδικασία η οποία είναι γνωστό ότι είναι επιρρεπής σε λάθη και χρονοβόρα. Στην εργασία αυτή, προτείνουμε μια λύση που επιτρέπει την απάντηση επερωτήσεων χρησιμοποιώντας οντολογίες που εξελίσσονται χωρίς επαναπροσδιορισμό των συσχετίσεων με τις πηγές. Προκειμένου να επιτευχθεί αυτό, ξεχωρίζουμε την σημασιολογία της μετεγγραφής επερωτήσεων για διαφορετικές εκδόσεις μιας οντολογίας και για τις πηγές και παρουσιάζουμε ένα σύστημα που επιτρέπει την εξέλιξη των οντολογιών πάνω από παραδοσιακά συστήματα ολοκλήρωσης πληροφοριών. Το σύστημά μας δέχεται σαν είσοδο την επερώτηση του χρήστη και τις διαφορετικές εκδόσεις μιας οντολογίας και μεταγράφει την επερώτηση σε συστήματα ολοκλήρωσης πληροφοριών που χρησιμοποιούν διαφορετικές εκδόσεις της συγκεκριμένης οντολογίας. Αυτό πραγματοποιείται με την αυτόματη αναγνώριση των αλλαγών ανάμεσα στις εκδόσεις μιας οντολογίας που χρησιμοποιώντας μια γλώσσα αλλαγών υψηλού επιπέδου, οι οποίες αργότερα αξιοποιούνται για την επανεγγραφή των επερωτήσεων. Σε ένα τέτοιο περιβάλλον, προχωρούμε στον εντοπισμό των προβλημάτων, και παρέχουμε αποτελεσματικές, διαισθητικές λύσεις. Αποδεικνύουμε ότι η προσέγγιση μας επιβαρύνει ελάχιστα τους παραδοσιακούς αλγορίθμους για επανεγγραφή επερωτήσεων, είναι επεκτάσιμη και κλιμακούμενη. Τέλος δείχνουμε ότι μειώνει σημαντικά την ανθρώπινη προσπάθεια που δαπανάται μια και ο συνεχής επαναπροσδιορισμό των συσχετίσεων δεν είναι πλέον απαραίτητος. (EL)
Due to the rapid scientific development, ontologies and schemata need to change. When ontologies evolve, the changes should somehow be rendered and used by the pre-existing data integration systems. In most of these systems, when ontologies change their relations with the data sources i.e. the mappings, are recreated manually, a process which is known to be error-prone and time-consuming. In this dissertation, we provide a solution that allows query answering under evolving ontologies without mapping redefinition. This is achieved by exploiting query rewriting. We elegantly separate the semantics of query rewriting for different ontology versions and for the sources and we present a module that enables ontology evolution over traditional ontology-based data integration systems. That module gets as input the different ontology versions and the user query, and rewrites the query over data integration systems that use different ontology versions. This is performed by the automatic identification of changes among the ontology versions using a high-level language of changes, which are then interpreted as GAV mappings to enable query rewriting among ontology versions. Although query rewriting always succeeds, several problems may occur due to non information preserving changes among the ontology versions. We identify the problems in such a setting and we provide efficient, intuitive solutions, either by explaining the reasons for the failure or by producing the best “over-approximations”. We prove that our approach imposes only a small overhead over traditional query rewriting algorithms and it is modular and scalable. Finally, we show that it can greatly reduce human effort spent since continuous mapping redefinition on evolving ontologies is no longer necessary. (EN)

Ολοκλήρωση πληροφοριών
Data integration
Query rewriting
Μετεγραφή επερωτήσεων



