Quete: Query Processing in distributed database systems

RDF 

 
Το τεκμήριο παρέχεται από τον φορέα :
Πανεπιστήμιο Κρήτης
Αποθετήριο :
E-Locus Ιδρυματικό Καταθετήριο
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο



Σημασιολογικός εμπλουτισμός/ομογενοποίηση από το EKT
2006 (EL)
Quete: Επεξεργασία Επερωτήσεων σε Κατανεμημένες Βάσεις Δεδομένων
Quete: Query Processing in distributed database systems

Κονδυλάκης, Χαρίδημος Γ (EL)
Kondylakis, Haridimos G (EN)

Η ραγδαία ανάπτυξη του διαδικτύου και η εκτεταμένη χρήση των συστημάτων διαχείρισης βάσεων δεδομένων, έφερε στο προσκήνιο την ανάγκη για την διασύνδεση ποικίλων πηγών πληροφορίας. Κύριο πρόβλημα σε ένα τέτοιο περιβάλλον είναι η ετερογένεια των διαφορετικών αυτών πηγών. Για την επίλυση του προβλήματος της ετερογένειας η βασική μας πρόταση είναι η ανεύρεση συσχετισμών ανάμεσα στα σχήματα και σε μια οντολογία αναφοράς, οι όροι της οποίας χρησιμοποιούνται για τον σχολιασμό των πηγών και για το σχηματισμό επερωτήσεων που απευθύνονται σ’ αυτές. Με την αποδοχή της οντολογίας ως κοινό σημείο αναφοράς οι ονομαστικές συγκρούσεις εξαλείφονται και οι σημασιολογικές διαφορές μειώνονται αισθητά. Η συνεισφορά μας στον τομέα είναι ένα σύστημα που παρέχει μια αυτόματη προσέγγιση στην ενοποίηση πολλαπλών πηγών πληροφορίας. Η ενοποίηση αυτή είναι διάφανη στον τελικό χρήστη, ο οποίος μπορεί να εκτελεί επερωτήσεις σε πηγές δεδομένων που εξελίσσονται και εμπλουτίζονται συνεχώς. Οι διάφορες σημασιολογικές επερωτήσεις συσχετίζονται αυτόματα με SQL επερωτήσεις οι οποίες απευθύνονται στις ξεχωριστές πηγές. Τα μεταδεδομένα κάθε σχήματος καταγράφονται σε XML έγγραφα, στα οποία αποθηκεύονται και τα σημασιολογικά ονόματα για κάθε στοιχείο των υποκείμενων πηγών. Προσδιορίζονται έτσι τα ταυτόσημα στοιχεία ανάμεσα στις πηγές. Το σύστημα έχει τη δυνατότητα να χειρίζεται πολύπλοκες συνενώσεις, να επιλέγει τα κατάλληλα γνωρίσματα, τις σωστές σχέσεις και τις απαραίτητες συνθήκες έτσι ώστε να διατηρείται η σημασιολογία των επερωτήσεων του χρήστη. Επιπλέον, μια και οι συνενώσεις ανάμεσα σε διαφορετικές βάσεις δεδομένων είναι ιδιαίτερα δύσκολες στο χειρισμό τους, υλοποιήθηκαν δυο αλγόριθμοι με σκοπό να μελετηθεί η αποδοτικότητα ενός τέτοιου συστήματος. Η μηχανή επερωτήσεων επεκτάθηκε για να υποστηρίζει και να αξιοποιεί οριζόντια και κατακόρυφη κατανομή σχεσιακών πινάκων. Όταν υπάρχει εκ των προτέρων η γνώση για τέτοιες κατανομές, η απόδοση του συστήματος αυξάνεται κατακόρυφα. Οι μετρήσεις που πραγματοποιήθηκαν έδειξαν ότι το σύστημα έχει αποδεκτή συμπεριφορά ακόμα και σε μεγάλες βάσεις δεδομένων. (EL)
The exponential growth of the web and the extended use of database management systems has brought to the fore the seamless interconnection of diverse and large numbers of information sources. The main problem in such an environment is the heterogeneity between these different sources. Our essential proposal to resolve the issue of heterogeneity, is finding mappings across schemata and a global reference ontology, the terms of which are used for annotation and querying. By accepting ontology as a point of common reference, naming conflicts are eliminated and semantic conflicts are reduced. Our contribution is a system that provides an automatic and scalable approach to integrate and then query transparently multiple data sources. It maps automatically semantic queries to SQL and presents the results to the user. Database metadata, are independently captured into XML documents, which also store semantic names for schema elements to identify identical concepts across systems. The query system is capable of handling complex join constructs, and choosing the appropriate attributes, relations and join conditions to preserve user query semantics. Moreover, since joins across databases are most difficult to handle, two join algorithms were implemented in order to study the efficiency of such a system. The query engine extended to support and exploit horizontal and vertical distribution of database’s tables. Those extensions boost the whole system performance when the knowledge of such a distribution exists. Experiments showed that the system has an acceptable performance even in large databases. (EN)

text

Πανεπιστήμιο Κρήτης (EL)
University of Crete (EN)

2006-07-19
2006-04-01




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.