Ο Σημασιολογικός Ιστός (ΣΙ) είναι μια εξελισσόμενη επέκταση του Παγκόσμιου Ιστού στην οποία
το περιεχόμενο μπορεί να εκφραστεί όχι μόνο με φυσική γλώσσα αλλά και με τυπικές γλώσσες
(π.χ.
RDF
/
S
) που επιτρέπουν την παροχή προηγμένων υπηρεσιών αναζήτησης, δια
μοιρασμού και
ολοκλήρωσης πληροφορίας.
Στις τεχνολογίες αυτές εδράζεται η τάση για δημοσίευση
περιεχομένου βάσει των αρχών των Διασυνδεδεμένων Δεδομένων.
Δυσ
τυχώς,
το μεγαλύτερο
μέρος του περιεχομένου που βρίσκεται στο διαδίκτυο
βασίζεται σε τεχνολογίες πο
υ
δεν
ανταποκρίν
ον
ται
στις αρχές του Σημασιολογικού Ιστού. Η πλειοψηφία των δεδομένων που είναι
διαθέσιμα
είναι σε μορφή σχεσιακών
, object
-
oriented και NoSQL βάσ
εων
δεδομένων
.
Για το
λόγο αυτό
έχουν αναπτυχθεί διάφορα
εργαλεία και
συστήματα
τα οποία
αναλαμβάνουν την
μετατροπή
αυτού του περιεχομένου
σε συνδεδεμένα δεδομένα.
Κάθε σύστημα ακολουθεί μια
δική του μέθοδο,
καθώς
αξίζει να σημειωθεί και η
γλώσσα
συσχετίσεων
R2RML που προτείν
εται
από το
W3C ως επίσημη γλώσσα για την έκφραση
αντιστοιχίσεων
από
σχεσιακές βάσεις δεδομένων σε RDF σύνολα δεδομένων.
Στην ε
ργασία
αυτή επικεντρωνόμαστε
στην X3ML
, μια
γλώσσα αντιστοιχήσεων που
σχεδιάστηκε από το
Ι
νστιτούτο
Πληροφορικής του ΙΤΕ
,
η οποία
είναι αναγνώσιμη από τον άνθρωπο, αρκετά γενική ώστε να καλύπτει τα
περισσότερα μοντέλα
δεδομένων που χρησιμοποιούνται στις μέρες μας
και πιο
εκφραστική
ως προς
τη διαδικασία
δημιουργίας
URI.
Ο
κύριος
στόχος
αυτής
της
μεταπτυχιακής
εργασίας
είναι η παροχή λειτουργιών για τη
διαχείριση αντιστοιχήσεων εκφρασμένες στη γλώσσα
X
3
ML
.
Αρχικά εντοπί
σαμε
τις
κύριες
περιπτώσεις χρήσης
(
business
use
cases
)
, συγκεκριμένα τις
α)
Δημιουργία μιας αντιστοίχισης
,
κατά την οποία
ο
χρήστης
θέλει να δημιουργήσ
ει μια
αντιστοίχηση
από
την αρχή
,
και
β)
Βελτίωση
μια
ς
αντιστοίχισης
κατά την οποία
ο
χρήστης
επιθυμεί
να βελτιώσει μια υπάρχουσα
αντιστοίχιση
,
να
ελέγ
ξει την ποιότητά
της, να
τη
συγκρίν
ει με άλλες
και
να παρακολουθ
εί
την
εξέλιξή
της. Βάσει αυτών ορίσαμε τις απαιτήσεις του συστήματος και εν συνεχεία σχεδιάσαμε
και υλοποιήσαμε
11
βασικές
λειτουργίες.
Οι
λειτουργίες αυτές
αφορούν στην
ανάλυση
των
σχημάτων που εμπλέκονται σε μία αντιστοίχηση,
σ
τον υπολογισμό ποσοστ
ών
κάλυψης,
στη
γρ
αφική
απεικόνιση
και
σύγκριση αντιστοιχίσεων
, και στην
παρακολούθηση της εξέλιξης
τους
.
Συγκεκριμένα, η
ανάλυση σχημάτων προσφέρει την δυνατότητα να περιηγηθ
ούμε
και να
καταλάβουμε καλύτερα
το περιεχόμενό τους.
Τα ποσοστά κάλυψης
παρέχουν
μια συνολική
εικ
όνα των στοιχείων που έχουν χρησιμοποιηθεί
ενώ
υπάρχει
και
η δυνατότητα εξαίρεσης των
στοιχείων
που
θεωρούνται ανεπιθύμητα για μία αντιστοίχηση.
Λειτουργίες
γραφικής
αναπαράστασης
προσφέρονται για την οπτικοποίηση μιας αντιστοίχησης με έμφαση
στα
συντακτικ
ά στοιχεία της γλώσσας
, και επίσης
παρέχεται
μια τρισδιάστατη
αλληλεπιδραστική
αναπαράσταση
.
Όσον αφορά
τη σύγκριση
,
λειτουργίες
όπως
κειμενική
σύγκριση των
αντίστοιχων
XML
αναπαραστάσεων
,
οπτικοποίηση
της διαφοράς
με γράφο
και
σύγκριση
παραγόμενων στιγμιότυπων
είναι εφικτές
.
Τέλος, η λειτουργία της παρακολούθησης της
εξέλιξης βοηθάει το χρήστη να
εντοπίσει
τα σημεία που έχουν αλλάξει κατά την πάροδο του
χρόνου.
Συνοψίζοντας,
η
καινοτομία έγκειται στον διαδραστικό χαρακτήρα όλων
των
λειτουργιών και στην τρισδιάστατη απεικόνιση των αντιστοιχίσεων
,
καθιστώντας την παρούσα
εργασία την πρώτη μελέτη εκτεταμένη
ς
διαχείριση
ς
αντιστοιχίσεων
στο συγκεκριμένο τομέα
.
(EL)
The Semantic Web (SW) is an evolving extension of the World Wide Web in which the content can
be expressed not only in
natural language, but also in formal languages (e.g. RDF/S) that can be
read and used by software agents, permitting them to find, share and integrate information more
easily. S
emantic Web technologies form the foundation for publishing data according to t
he
principles of Linked Data.
Unf
ortunately, most web content is based on technologies that
do not
meet
the principles of the Semantic Web. T
he majority of
the
data
is available in relational
, object
-
oriented and NoSQL databases
.
For this reason several sy
stems have been developed for
converting and publishing content as
linked
data.
Ε
ach system follows
its
own
method
,
while
it is
worth noting
the R2RML mapping language
proposed by W3C as an official language for
expressing mappings from relational database
s in RDF datasets
.
In this
work
we focus on X3ML
language
;
a mapping
formalism
designed by the Institute of Computer Science of FORTH, which
is
human readable, generic enough to cover most of the data models used nowadays
and more
explicit with the URI
g
enerating process.
The main objective of this
MSc
thesis is to provide
a complete analysis
of
mappings
expressed in
X3ML language. First
ly,
we identify the main business use cases,
a)
Create a Mapping
in
which the
actor wants to
generate
a mapping from sc
ratch, b)
Improve a Mapping
in
which
the actor
needs
to improve it, check its quality, compare with others and monitor its evolution.
Based on these,
we defined
the
system requirements and then design
ed
and implement
ed
11
basic functionalities
.
These funct
ion
alities
refer to the
analysis
of
the
schema
s
involved in a particular mapping
,
the
calculation of
coverage metrics
, the graphical representation and comparison
of mappings
, and
the
monitor
ing of
their evolution.
More s
pecifically, the analysis
of schemas
offers the
opportunity o
f
navigat
ing
and better understand
ing
the
content. The coverage
metrics
give
an
overview of
the mapped
data and
allow
excluding elements that are considered undesirable for a
mapping
.
For the g
raphical representation
,
we
introduce
functionalities
that visualize
a mapping
,
focusing
on syntactic elements of
the
language, and
provide
a three
-
dimensional interactive
representation.
As
regards
comparisons,
several
function
alities are
offered
such as
textual
comparison of
mappings in XML
format
, representation of difference
s through graph
and
compari
son of
generated
instances
.
Finally, the
functionality
of
tracking
the
evolution of
a
mapping
helps the user
to identify
the
basic
points
that
have changed over time.
All in all
,
the
main novelty of this work is the interactivity of all functionalities and 3D visualization of mappings.
(EN)