Storage of RDF Metadata for Community Web Portals

RDF 

 
This item is provided by the institution :
University of Crete
Repository :
E-Locus Institutional Repository
see the original item page
in the repository's web site and access all digital files if the item*
share



Semantic enrichment/homogenization by EKT
2001 (EN)
Αποθήκευση Μεταδεδομένων RDF για Πύλες Κοινοτήτων Διαδικτύου
Storage of RDF Metadata for Community Web Portals

Αλεξάκη, Σοφία Μ (EL)
Alexaki, Sofia M (EN)

Τα τελευταία χρόνια υπάρχει αυξημένο ενδιαφέρον για τις πύλεσ κοινοτήτων διαδικτύου (π.χ. εταιρικές, ηλεκτρονικού εμπορίου). Αναπόσπαστο μέρος μιας πύλης αποτελεί ο κατάλογος γνώσης στον οποίο αποθηκεύονται ποικίλα είδη μεταδεδομένων (π.χ. ταξινόμησης, διαχείρισης, αξιολόγησης περιεχομένου, ασφαλείας κτλ.) για τους πληροφοριακούς πόρους που υπάρχουν στην κοινότητα (π.χ. έγγραφα, δεδομένα). Ο κατάλογος γνώσης υποστηρίζει την οργάνωση του περιεχομένου με διαφορετικούς τρόπους, χρησιμοποιώντας διάφορες οντολογίες και λεξιλόγια διαθέσιμα σε μια κοινότητα. Μέσα σ'αυτό το πλαίσιο οι βασικές λειτουργίες που υποστηρίζονται από μια πύλη είναι επερώτηση των πληροφοριακών πόρων με σημασιολογικά κατανοητό τρόπο, προσαρμογή περιεχομένου στον εκάστοτε χρήστη και ολοκλήρωση ετερογενών πηγών. Ο μεγάλος όγκος του καταλόγου γνώσης (π.χ. Open Directory: 180 Mbytes για κατηγορίες και 700 Mbytes για περιγραφές) καθιστά τη διαχείριση μεταδεδομένω με τη χρήση συστημάτων βάσεων δεδομένων ένα ιδιαίτερα ενδιαφέρον ζήτημα. Ένα πρ'οτυπο που έχει προταθείπρόσφατσα για την περιγραφή πόρων και το οποίο καλύπτει τις ανάγκες μεταδεδομένων για πύλες κοινοτήτων διαδικτύου είναι το RDF. Αντικείμενο της παρούσας εργασίας είναι η αναπαράσταση και αποθήκευση μεταδεδομένων σε συστήματα οντοκεντρικών σχεσιακών βάσεων δεδομένων. Οι ιδιαιτερότητες του RDF σε σχέση με τα παραδοσιακά μοντέλα δεδομένων καθιστούν την αναπαράσταση του σε συστήματα βάσεων δεδομένων αρκετά πολύπλοκη. Προκειμένου να καθορίσουμε τους σημασιολογικούς περιορισμούς που πρέπει να πληρούν τα μεταδεδομένα σε μια κοινότητα διαδικτύου αλλά και για να πετύχουμετην αποτελεσματική αποθήκευση τους μελετούμε μια θεωρητική θεμελίωση του RDF χρησιμοποιώντας την γλώσσα παράστασης γνώσης Telos. Το μοντέλο αναπαράστασης που προτείνουμε υποστηρίζει την εκφραστικότητα και ελευθερία περγραφών που παρέχει το RDF και τη δυνατότητα πολλαπλής ταξινόμησης. Επίσης λαμβάνει υπόψη την ιδιαιτερότητα του RDF γράφου που έχει ετικέτες τόσο στις ακμές όσο και στους κόμβους, παρέχει δυνατότητα βελτιστοποίησης της επεξεργασίας των ιεραρxιών κλάσεων και ιδιοτήτων και συμβάλλει στη δημιουργία αποδοτικών επερωτήσεων. Ένα ιδιαίτερο χαρκτηριστικό του συστήματος που έχει υλοποιηθεί είναι ότι καθιστά δυνατή τη βαθμιαία φόρτωση των δεδομέων RDF και σχημάτων στη βάση, κάτι ιδιαίτερα σημαντικό για μεγάλους όγκους RDF μεταδεδομένων. (EL)
An increasing interest in Community Web Portals (corporate, e-marketplace etc.) can be observed over the last few years. The core Portal component is the Knowledge Catalog holding different types of metadata(e.g. cataloguing, content rating,) associated with different types of portal resources (e.g documents, data) that are available to the community members. The Knowledge Catalog supports the organization of the content of the portal in a multitude of ways by employing ontologies and theusari. Fundamental services of a Portal, such as queryning in semantically meaningful way, personalization and integration of heterogeneous sources, are based on the knowledge Catalog. The expected large volume of the knowledge catalog(for instance, the Open Directory Portal of Netscape comprisrs around 180M of Subject Topics and 700M of indexed URLS) makes the management of metadata using database management systems a challenging topic. RDF, a W3C recommendation is by now a standard framework for the description of resources. The topic of this thesis is the representation and the efficient storage of RDF metadata in object-relational database management systems (ORDBMS). Due to the peculiarities of RDF in comparison to conventional data model (e.g. properties are first class objects, optional and multivalued properties, specialization between properties), its representation in ORDBMS is fairly complex. In order to define the semantic constraints which metadata of a community should conform to and to achieve its effective storage, we study the theoretical underpinnings of the problem using the knowledge representation language Telos. Our general model is expressive enough to represent the majority of RDF primitives as well as multiple instantiation. It also considers tha RDF graphs have labels on both nodes and edges, optimizes processing of class/property hierarchies and ensures better query performance. A distinctive feature of our system is the fact that it enables incremental loading of RDF desriptions and schemas, wich is crucial for handling tha large volumes of RDF metadata. (EN)

text

Πανεπιστήμιο Κρήτης (EL)
University of Crete (EN)

2001-03-01
2001-01-10




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)