Σήμερα, πολλοί Γνωσιακοί Γράφοι, εκφρασμένοι σε RDF, διαδραματίζουν κρίσιμο ρόλο στην συγκέντρωση και ενοποίηση δεδομένων από διαφορετικές πηγές. Θα ήταν πολύτιμο να μπορούμε να εμβαθύνουμε στην ανάλυση αυτών των γράφων για να ενισχύσουμε την κατανόησή μας και την εξαγωγή συμπερασμάτων. Ωστόσο, η διατύπωση αναλυτικών επερωτήσεων σε Γράφους Γνώσης RDF είναι δύσκολη αφού προϋποθέτει εξοικείωση και με το συντακτικό των αντίστοιχων γλωσσών επερώτησης (ήτοι την SPARQL) και με τα περιεχόμενα του Γνωσιακού Γράφου. Για να απαλύνουμε αυτό το πρόβλημα, προτείνουμε ένα διαδραστικό μοντέλο για να βοηθήσουμε τους χρήστες να διατυπώνουν αναλυτικά ερωτήματα σε πολύπλοκους RDF Γράφους Γνώσης, ανεξάρτητα από τη δομή του σχήματός τους. Αυτό είναι ιδιαίτερα σημαντικό, καθώς σε γνωσιακούς γράφους που δεν βασίζονται σε Star σχήματα, η παρουσία περίπλοκων συνδέσεων απαιτεί μια πιο σύνθετη προσέγγιση διατύπωσης επερωτήσεων. Για να προσφέρουμε μια διαισθητική διεπαφή, αξιοποιούμε την εξοικείωση των χρηστών με τα συστήματα Πολύπλευρης Αναζήτησης (Faceted Search), επεκτείνοντας ένα τέτοιο μοντέλο που θα προσφέρει και δυνατότητες ανάλυσης με έναν προσιτό και φιλικό προς τον χρήστη τρόπο. Συγκεκριμένα, ξεκινώντας από ένα γενικό μοντέλο για Πολύπλευρη Αναζήτηση επί δεδομένων RDF, το επεκτείνουμε με ενέργειες που δίνουν τη δυνατότητα στους χρήστες να διατυπώνουν και σύνθετα αναλυτικά ερωτήματα. Αυτές οι ενέργειες αντιστοιχούν σε επερωτήσεις μιας γλώσσας επερωτήσεων υψηλού επιπέδου για ανάλυση δεδομένων, που ονομάζεται HIFUN, τις οποίες κατόπιν μεταφράζουμε σε SPARQL. Μάλιστα, το προτεινόμενο διαδραστικό μοντέλο εξυπηρετεί διττό σκοπό, απευθυνόμενο όχι μόνο στη διατύπωση αναλυτικών ερωτημάτων, αλλά και στην εξερεύνηση των δεδομένων αφού επιτρέπει στους χρήστες να μεταβαίνουν απρόσκοπτα από τον εντοπισμό πόρων με τρόπο Πολύπλευρης Αναζήτησης στην εκτέλεση εις βάθος αναλύσεων του υποκείμενου Γράφου Γνώσης RDF. Αυτό καλύπτει τις διαφορετικές ανάγκες των χρηστών, προσφέροντας ευέλικτη και δυναμική εξερεύνηση και ανάλυση του γράφου. Επιπροσθέτως, η διατύπωση ερωτημάτων, συμπεριλαμβανομένων των εμφωλευμένων, είναι σταδιακή αναγνωρίζοντας τον επαναληπτικό χαρακτήρα της ανάλυσης δεδομένων. Αυτή η διαδικασία περιλαμβάνει επαναλαμβανόμενα βήματα εκλέπτυνσης, επιτρέποντας στους χρήστες να εμβαθύνουν τα ερωτήματά τους καθώς αποκτούν πληροφορίες για τη δομή και το περιεχόμενο του γράφου. Συνολικά, οι κύριες συνεισφορές της διατριβής αυτής είναι: (ι) προτείνουμε φιλική προς το χρήστη διεπαφή για διαισθητική ανάλυση Γράφων Γνώσης RDF και, (ιι) ορίζουμε τυπικά τον χώρο καταστάσεων του μοντέλου αλληλεπίδρασης καθώς και τους αλγόριθμους που απαιτούνται για την παραγωγή ενεργειών για τη διεπαφή χρήσης. Παρέχουμε επίσης μια λεπτομερή περιγραφή και πλήρη υλοποίηση του μοντέλου και των σχετικών αλγορίθμων, καταδεικνύοντας τη εφικτότητά του σε σενάρια πραγματικού κόσμου. Αυτό τονίζει την πρακτική εφαρμογή της προσέγγισής μας, καθιστώντας την πολύτιμη τόσο για τους αναλυτές όσο και για τους απλούς χρήστες που ασχολούνται με Γράφους Γνώσης RDF. Τέλος, σχολιάζουμε την αξιολόγηση του συστήματος από χρήστες, της οποίας τα αποτελέσματα ήταν πολύ θετικά αναφορικά με την αποδοχή και την αποτελεσματικότητα της μεθόδου. Αυτή η εμπειρική επικύρωση όχι μόνο τονίζει την αποτελεσματικότητα του μοντέλου μας, αλλά έδωσε και ανατροφοδότηση για τη μελλοντική επέκτασή του. Ουσιαστικά, η έρευνά μας όχι μόνο αντιμετωπίζει την πολυπλοκότητα της διατύπωσης αναλυτικών ερωτημάτων σε Γράφων Γνώσης RDF, αλλά δίνει επίσης έμφαση στην αποδοχή των χρηστών.
(EL)
Today, numerous Knowledge Graphs, expressed in RDF, play a crucial role in consolidating
and integrating data from diverse sources. It would be very valuable to delve into the
analysis of these graphs for enhanced insights and understanding. However, formulating
analytical queries over Knowledge Graphs in RDF is a challenging task due to the complexity
and scale of these graphs that presupposes familiarity with the syntax of the corresponding
query language (i.e. SPARQL) and the contents of the graph. To alleviate this
problem, we introduce an interactive model to assist users in formulating analytic queries
over complex RDF Knowledge Graphs, irrespective of their schema structure. This is particularly
crucial, since in non-star-schema-based knowledge graphs, the presence of nonstar-
schema relationships requires a more complex querying approach. To provide an intuitive
interface,we leverage users’ familiarity with Faceted Search systems, andwe extend
it for enabling the formulation of analytic queries in a user-friendly way. In particular, we
start from a general model for Faceted Search over RDF data, and we extend it with actions
that empower users to formulate simple and complex analytic queries, as well. These actions
correspond to queries of a high-level query language for analytics, named HIFUN,
that we then translate to SPARQL.Most, the proposed interactive model serves a dual purpose,
addressing not only the formulation of analytic queries, but also the formulation of
exploratory queries; it lets users transition seamlessly from locating resources in a Faceted
Search manner to performing in-depth analyses of the underlying RDF Knowledge Graph.
This accommodates the diverse needs of users, enabling both flexible and dynamic exploration
and analysis of the graph. Additionally, the formulation of queries, including nested
ones, is gradual acknowledging the iterative nature of data analysis. This process involves
repeated and refining steps, allowing users to deepen their queries as they gain insights
into the graph’s structure and content. Overall, the main contributions of this dissertation
are: (i) we present a user-friendly interface for intuitively analyzing RDF Knowledge
Graphs, and (ii) we formally define the state-space of the interaction model as well as the
algorithms needed to produce user interface actions. We also describe and provide a complete
implementation of the model and the relating algorithms, showcasing its feasibility
in real-world scenarios. This emphasizes the practical applicability of our approach, making
it valuable both for analysts and ordinary users dealing with RDF Knowledge Graphs.
Finally, we discuss the results of a user evaluation, providing evidence of the method’s acceptance.
This empirical validation not only underscores the effectiveness of our model,
but also sheds light on future development. In essence, our research not only tackles the complexities of formulating analytic queries over RDF Knowledge Graphs, but also emphasizes
the friendliness and acceptance by users.
(EN)