View Materialization Alternatives in Property-Graph Databases

View Materialization Alternatives in Property-Graph Databases

URI: https://www.openarchives.gr/aggregator-openarchives/edm/pergamos/000005-uoadl%3A3396077
RDF/XML JSON-LD

This item is provided by the institution :
/aggregator-openarchives/portal/institutions/uoa

Repository :
Πέργαμος

see the original item page
in the repository's web site and access all digital files if the item^*

Title

View Materialization Alternatives in Property-Graph Databases

Creator

Πλας Κωνσταντίνος (EL)

Plas Konstantinos (EN)

Type

born_digital_postgraduate_thesis

Διπλωματική Εργασία (EL)

Postgraduate Thesis (EN)

Διπλωματική εργασία
Master thesis (EN)

Date

2024

Year

2024 (EL)

Description

Τα συστήματα διαχείρισης βάσεων δεδομένων γραφημάτων έχουν αποκτήσει σημαντική δημοτικότητα λόγω της εγγενούς τους ικανότητας να αναπαριστούν πληροφορίες από διάφορους τομείς με τη μορφή γράφων. Τα συστήματα διαχείρισης βάσεων δεδομένων γραφημάτων διευκολύνουν την αναπαράσταση δεδομένων που σχετίζονται με κοινωνικά δίκτυα, χημικές ενώσεις και γράφους γνώσης, χρησιμοποιώντας κόμβους, ακμές, ετικέτες και ιδιότητες. Τα συστήματα διαχείρισης βάσεων δεδομένων γραφημάτων που ακολουθούν ένα εγγενές μοντέλο αποθήκευσης γράφων επιδεικνύουν εξαιρετική αποδοτικότητα τόσο στην αποθήκευση δεδομένων όσο και στην απόκριση σε επερωτήματα διάσχισης μέσα σε βάσεις δεδομένων γράφων. Παρόλα αυτά, προκύπτει μια πρόκληση κατά το χειρισμό σύνθετων αναλυτικών επερωτημάτων, γεγονός που καθιστά αναγκαία την ανάπτυξη νέων τεχνικών για την επιτάχυνση της εκτέλεσής τους. Στην παρούσα μελέτη, αντιμετωπίζουμε το ζήτημα της υλοποίησης όψεων για την επιτάχυνση της απάντησης αναλυτικών-ερωτημάτων σε εγγενείς βάσεις δεδομένων γραφημάτων. Πιο συγκεκριμένα, εστιάζουμε στον προσδιορισμό των τύπων όψεων που δύναται να υλοποιηθούν για να επιταχύνουμε την εκτέλεση επερωτημάτων που χαρακτηρίζονται από επαναλαμβανόμενα μοτίβα. Παρουσιάζουμε διάφορες εναλλακτικές όψεις για την βελτίωση του αρχικού μας γράφου και παρέχουμε τεχνικές αναδιατύπωσης ερωτημάτων για την απάντηση σε επερχόμενα επερωτήματα με τη χρήση αυτών των προ-υπολογισμένων προβολών. Η έρευνά μας επικεντρώνεται στα χαρακτηριστικά των επαναλαμβανόμενων μοτίβων εντός του φόρτου εργασίας των επερωτημάτων και διερευνά τη σχέση μεταξύ των χαρακτηριστικών των όψεων και των δίαφορων τύπων ερωτημάτων. Για να εξετάσουμε την προαναφερθείσα αντιστοιχία, κατασκευάσαμε ένα πρωτότυπο σύ- στημα που αναγνωρίζει μοτίβα επερωτημάτων χρησιμοποιώντας τεχνικές εξόρυξης συ- χνών μοτίβων, ενώ παράλληλα χρησιμοποιεί παραλλαγές του προβλήματος Knapsack για να επιλέξει τις καλύτερες όψεις για ένα δεδομένο φόρτο εργασίας επερωτήματος. Τα πειράματά μας υπογράμμισαν την υποαπόδοση του επικρατέστερου τύπου όψεων σε συστήματα διαχείρισης βάσεων δεδομένων γραφημάτων, σε διάφορους τύπους επερω- τημάτων. Εισάγοντας εναλλακτικές προσεγγίσεις, επιτύχαμε μια αξιοσημείωτη βελτίωση έως και 4,45 φορές στην αποδοτικότητα εκτέλεσης επερωτημάτων και πάνω από 2 φορές μείωση του κόστους αποθήκευσης. Αυτό υποδηλώνει ότι η υιοθέτηση ενός πιο ευέλικτου μοντέλου όψεων και ευρετηρίασης μπορεί να αποφέρει σημαντικές βελτιώσεις στην απόδοση των επερωτημάτων και την αποδοτικότητα της αποθήκευσης των όψεων. (EL)

Graph Database Management Systems (GDMSs) have gained significant popularity due to their inherent capability to represent information from diverse domains in the form of graphs. GDMSs facilitate the representation of data related to social networks, chemical compounds, and knowledge graphs, utilizing nodes, edges, labels, and properties. GDMSs that adhere to a native graph storage model demonstrate exceptional efficiency in both data storage and response to traversal queries within graph databases. Never- theless, a challenge emerges when handling complex analytical queries within these sys- tems, necessitating the development of novel techniques to accelerate their execution. In this study, we tackle the issue of view materialization to expedite analytical-query an- swering in property-graph databases. More specifically, our focus is on identifying the types of views that should be materialized to accelerate the execution of queries featuring recurring patterns. We introduce various view alternatives to augment our initial graph and provide query rewriting techniques for responding to upcoming queries using these pre- computed views. Our research centers on the characteristics of recurrent patterns within the query workload and explores the relationship between view characteristics and query types. To examine the aforementioned correspondence, we have built a prototype system that identifies query patterns using frequent pattern mining techniques while employing variations of the Knapsack problem to select the best views for a query workload. Our experimentation underscored the underperformance of subgraph materialization, the prevailing view type in GDMSs, across various query types. However, by introducing alternative approaches, we achieved a remarkable enhancement of up to 4.45 times in query execution efficiency and over a 2x reduction in storage costs. This suggests that adopting a more flexible view and indexing model can yield significant improvements in performance and storage efficiency. (EN)

Scientific field

Τεχνολογία – Πληροφορική

Επιστήμες Μηχανικού και Τεχνολογία ▶ Επιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ
Communication engineering and systems, Telecommunications (EN)

Φυσικές Επιστήμες ▶ Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Computer Science (EN)

Subject

Τεχνολογία – Πληροφορική (EL)

Technology - Computer science (EN)

Language

English

School / Department / Institute

Βιβλιοθήκη και Κέντρο Πληροφόρησης » Βιβλιοθήκη Σχολής Θετικών Επιστημών » Πληροφορική

Σχολή Θετικών Επιστημών » Τμήμα Πληροφορικής & Τηλεπικοινωνιών » ΠΜΣ Πληροφορική » Κατεύθυνση Διαχείριση Δεδομένων, Πληροφορίας και Γνώσης

Rights

https://creativecommons.org/licenses/by-nc/4.0/

Provider

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών

Repository / collection

Πέργαμος

Subcollections

Postgraduate Thesis

*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)

View Materialization Alternatives in Property-Graph Databases

Βοηθείστε μας να κάνουμε καλύτερο το OpenArchives.gr.