Το τεκμήριο παρέχεται από τον φορέα :
Πανεπιστήμιο Κρήτης   

Αποθετήριο :
E-Locus Ιδρυματικό Καταθετήριο   

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Interactive analytics over RDF knowledge graphs
Διαδραστική ανάλυση γραφών RDF

Παπαδάκη, Μαρία-Ευαγγελία Ε

Αντωνίου, Γρηγόριος
Τζίτζικας, Ιωάννης
Μαγκούτης, Κωνσταντίνος
Παπαθεοδώρου, Χρήστος
Πλεξουσάκης, Δημήτριος
Σπυράτος, Νικόλαος
Παπαγιαννάκης, Γεώργιος

Τύπος Εργασίας--Διδακτορικές διατριβές
text

2024-07-26


Σήμερα, πολλοί Γνωσιακοί Γράφοι, εκφρασμένοι σε RDF, διαδραματίζουν κρίσιμο ρόλο στην συγκέντρωση και ενοποίηση δεδομένων από διαφορετικές πηγές. Θα ήταν πολύτιμο να μπορούμε να εμβαθύνουμε στην ανάλυση αυτών των γράφων για να ενισχύσουμε την κατανόησή μας και την εξαγωγή συμπερασμάτων. Ωστόσο, η διατύπωση αναλυτικών επερωτήσεων σε Γράφους Γνώσης RDF είναι δύσκολη αφού προϋποθέτει εξοικείωση και με το συντακτικό των αντίστοιχων γλωσσών επερώτησης (ήτοι την SPARQL) και με τα περιεχόμενα του Γνωσιακού Γράφου. Για να απαλύνουμε αυτό το πρόβλημα, προτείνουμε ένα διαδραστικό μοντέλο για να βοηθήσουμε τους χρήστες να διατυπώνουν αναλυτικά ερωτήματα σε πολύπλοκους RDF Γράφους Γνώσης, ανεξάρτητα από τη δομή του σχήματός τους. Αυτό είναι ιδιαίτερα σημαντικό, καθώς σε γνωσιακούς γράφους που δεν βασίζονται σε Star σχήματα, η παρουσία περίπλοκων συνδέσεων απαιτεί μια πιο σύνθετη προσέγγιση διατύπωσης επερωτήσεων. Για να προσφέρουμε μια διαισθητική διεπαφή, αξιοποιούμε την εξοικείωση των χρηστών με τα συστήματα Πολύπλευρης Αναζήτησης (Faceted Search), επεκτείνοντας ένα τέτοιο μοντέλο που θα προσφέρει και δυνατότητες ανάλυσης με έναν προσιτό και φιλικό προς τον χρήστη τρόπο. Συγκεκριμένα, ξεκινώντας από ένα γενικό μοντέλο για Πολύπλευρη Αναζήτηση επί δεδομένων RDF, το επεκτείνουμε με ενέργειες που δίνουν τη δυνατότητα στους χρήστες να διατυπώνουν και σύνθετα αναλυτικά ερωτήματα. Αυτές οι ενέργειες αντιστοιχούν σε επερωτήσεις μιας γλώσσας επερωτήσεων υψηλού επιπέδου για ανάλυση δεδομένων, που ονομάζεται HIFUN, τις οποίες κατόπιν μεταφράζουμε σε SPARQL. Μάλιστα, το προτεινόμενο διαδραστικό μοντέλο εξυπηρετεί διττό σκοπό, απευθυνόμενο όχι μόνο στη διατύπωση αναλυτικών ερωτημάτων, αλλά και στην εξερεύνηση των δεδομένων αφού επιτρέπει στους χρήστες να μεταβαίνουν απρόσκοπτα από τον εντοπισμό πόρων με τρόπο Πολύπλευρης Αναζήτησης στην εκτέλεση εις βάθος αναλύσεων του υποκείμενου Γράφου Γνώσης RDF. Αυτό καλύπτει τις διαφορετικές ανάγκες των χρηστών, προσφέροντας ευέλικτη και δυναμική εξερεύνηση και ανάλυση του γράφου. Επιπροσθέτως, η διατύπωση ερωτημάτων, συμπεριλαμβανομένων των εμφωλευμένων, είναι σταδιακή αναγνωρίζοντας τον επαναληπτικό χαρακτήρα της ανάλυσης δεδομένων. Αυτή η διαδικασία περιλαμβάνει επαναλαμβανόμενα βήματα εκλέπτυνσης, επιτρέποντας στους χρήστες να εμβαθύνουν τα ερωτήματά τους καθώς αποκτούν πληροφορίες για τη δομή και το περιεχόμενο του γράφου. Συνολικά, οι κύριες συνεισφορές της διατριβής αυτής είναι: (ι) προτείνουμε φιλική προς το χρήστη διεπαφή για διαισθητική ανάλυση Γράφων Γνώσης RDF και, (ιι) ορίζουμε τυπικά τον χώρο καταστάσεων του μοντέλου αλληλεπίδρασης καθώς και τους αλγόριθμους που απαιτούνται για την παραγωγή ενεργειών για τη διεπαφή χρήσης. Παρέχουμε επίσης μια λεπτομερή περιγραφή και πλήρη υλοποίηση του μοντέλου και των σχετικών αλγορίθμων, καταδεικνύοντας τη εφικτότητά του σε σενάρια πραγματικού κόσμου. Αυτό τονίζει την πρακτική εφαρμογή της προσέγγισής μας, καθιστώντας την πολύτιμη τόσο για τους αναλυτές όσο και για τους απλούς χρήστες που ασχολούνται με Γράφους Γνώσης RDF. Τέλος, σχολιάζουμε την αξιολόγηση του συστήματος από χρήστες, της οποίας τα αποτελέσματα ήταν πολύ θετικά αναφορικά με την αποδοχή και την αποτελεσματικότητα της μεθόδου. Αυτή η εμπειρική επικύρωση όχι μόνο τονίζει την αποτελεσματικότητα του μοντέλου μας, αλλά έδωσε και ανατροφοδότηση για τη μελλοντική επέκτασή του. Ουσιαστικά, η έρευνά μας όχι μόνο αντιμετωπίζει την πολυπλοκότητα της διατύπωσης αναλυτικών ερωτημάτων σε Γράφων Γνώσης RDF, αλλά δίνει επίσης έμφαση στην αποδοχή των χρηστών. (EL)
Today, numerous Knowledge Graphs, expressed in RDF, play a crucial role in consolidating and integrating data from diverse sources. It would be very valuable to delve into the analysis of these graphs for enhanced insights and understanding. However, formulating analytical queries over Knowledge Graphs in RDF is a challenging task due to the complexity and scale of these graphs that presupposes familiarity with the syntax of the corresponding query language (i.e. SPARQL) and the contents of the graph. To alleviate this problem, we introduce an interactive model to assist users in formulating analytic queries over complex RDF Knowledge Graphs, irrespective of their schema structure. This is particularly crucial, since in non-star-schema-based knowledge graphs, the presence of nonstar- schema relationships requires a more complex querying approach. To provide an intuitive interface,we leverage users’ familiarity with Faceted Search systems, andwe extend it for enabling the formulation of analytic queries in a user-friendly way. In particular, we start from a general model for Faceted Search over RDF data, and we extend it with actions that empower users to formulate simple and complex analytic queries, as well. These actions correspond to queries of a high-level query language for analytics, named HIFUN, that we then translate to SPARQL.Most, the proposed interactive model serves a dual purpose, addressing not only the formulation of analytic queries, but also the formulation of exploratory queries; it lets users transition seamlessly from locating resources in a Faceted Search manner to performing in-depth analyses of the underlying RDF Knowledge Graph. This accommodates the diverse needs of users, enabling both flexible and dynamic exploration and analysis of the graph. Additionally, the formulation of queries, including nested ones, is gradual acknowledging the iterative nature of data analysis. This process involves repeated and refining steps, allowing users to deepen their queries as they gain insights into the graph’s structure and content. Overall, the main contributions of this dissertation are: (i) we present a user-friendly interface for intuitively analyzing RDF Knowledge Graphs, and (ii) we formally define the state-space of the interaction model as well as the algorithms needed to produce user interface actions. We also describe and provide a complete implementation of the model and the relating algorithms, showcasing its feasibility in real-world scenarios. This emphasizes the practical applicability of our approach, making it valuable both for analysts and ordinary users dealing with RDF Knowledge Graphs. Finally, we discuss the results of a user evaluation, providing evidence of the method’s acceptance. This empirical validation not only underscores the effectiveness of our model, but also sheds light on future development. In essence, our research not only tackles the complexities of formulating analytic queries over RDF Knowledge Graphs, but also emphasizes the friendliness and acceptance by users. (EN)


Faceted Search

Αγγλική γλώσσα





*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.