Παράλληλη και Κατανεμημένη Επεξεργασία Ερωτημάτων Κορυφογραμμής στο σύστημα Spark

 
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2016 (EL)
Παράλληλη και Κατανεμημένη Επεξεργασία Ερωτημάτων Κορυφογραμμής στο σύστημα Spark

Παπαρίδης, Κωνσταντίνος

Η αποτελεσματική διαχείριση των μεγάλων πολυδιάστατων συνόλων δεδομένων έχει προσελκύσει τεράστια προσοχή στην ερευνητική κοινότητα των βάσεων δεδομένων. Τέτοια μεγάλα πολυδιάστατα σύνολα δεδομένων είναι πολύ κοινά και αποδοτικοί αλγόριθμοι χρειάζονται για την ανάλυση αυτών των συνόλων δεδομένων για μια ποικιλία εφαρμογών. Σύνθετα ερωτήματα, όπως ερωτήματα εύρεσης κορυφογραμμών, έχουν γίνει, όχι μόνο χρήσιμα, αλλά και απαραίτητα, προκειμένου να βοηθήσει τους χρήστες να χειριστούν το τεράστιο ποσό των διαθέσιμων δεδομένων εντοπίζοντας μια σειρά από ενδιαφέροντα αντικείμενα δεδομένων. Τεχνικές διαμέρισης του χώρου, όπως η αναδρομική διαίρεση του χώρου των δεδομένων, έχουν χρησιμοποιηθεί για την επεξεργασία ερωτημάτων κορυφογραμμής σε παράλληλες, κατανεμημένες και «centralized» ρυθμίσεις. Δυστυχώς, τέτοιες διαχωρίσεις πλέγματος δεν είναι κατάλληλες στην περίπτωση ενός παράλληλου ερωτήματος κορυφογραμμής, όπου όλες οι κατατμήσεις εξετάζονται ταυτόχρονα, δεδομένου ότι πολλά τμήματα δεν συμβάλλουν στη συνολική κορυφογραμμή, με αποτέλεσμα σε πολλές περιττές επεξεργασίες. Αυτή η διατριβή επικεντρώνεται στην μελέτη του σχεδιασμού, της ανάπτυξης και τη σύγκριση των τριών αλγορίθμων για παράλληλα ερωτήματα κορυφογραμμών. Η παρουσιαζόμενη εφαρμογή έχει αναπτυχθεί στο σύστημα Spark, χρησιμοποιώντας τεχνικές διαχωρισμού του χώρου. Μια σειρά πειραμάτων θα παρουσιαστεί που θα δείξει ότι οι τεχνικές αυτές είναι κατάλληλες για την επεξεργασία ερωτημάτων κορυφογραμμές σε παράλληλες αρχιτεκτονικές. Μια συγκριτική ανάλυση των επιδόσεων των τριών αλγορίθμων που χρησιμοποιούνται, θα δοθεί. Όπως θα αποδειχθεί από πειραματικές μελέτες, οι τεχνικές αυτές είναι μια αποτελεσματική και επεκτάσιμη λύση για την επεξεργασία ερωτημάτων κορυφογραμμών σε παράλληλα και κατανεμημένα περιβάλλοντα.
Efficient management of large multi-dimensional data sets has attracted tremendous attention in the research community of databases. Such large multidimensional data sets are very common and efficient algorithms required for the analysis of these data sets for a variety of applications. Advanced query operators, such as skyline queries, have become, not just useful, but indispensable, in order to help users handle the huge amount of available data by identifying a set of interesting data objects. Space partition techniques, such as recursive division of the data space, have been used for skyline query processing in centralized, parallel and distributed settings. Unfortunately, such grid-based partitioning is not suitable in the case of a parallel skyline query, where all partitions are examined simultaneously, since many data partitions do not contribute to the overall skyline set, resulting in a lot of redundant processing. This thesis focuses on studying the design, development and comparison of three algorithms to parallel skyline query computation. The presented implementation is being developed on Spark system, using space partitioning techniques. A set of experiments will be demonstrated that will show that these techniques are suitable for skyline query processing in parallel architectures. A comparative performance analysis for the three algorithms used, will also be provided. As it will be demonstrated by experimental studies, these techniques are an efficient and scalable solution for skyline query processing in parallel and distributed environments.

info:eu-repo/semantics/bachelorThesis
Graduate Thesis / Πτυχιακή Εργασία

Distributed Computation
Skyline Query
Κατανεμημένος Υπολογισμός
Spark
Ερώτημα Κορυφογραμμής

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (EL)
Aristotle University of Thessaloniki (EN)

Ελληνική γλώσσα

2016
2016-10-31T11:57:27Z


Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής

This record is part of 'IKEE', the Institutional Repository of Aristotle University of Thessaloniki's Library and Information Centre found at http://ikee.lib.auth.gr. Unless otherwise stated above, the record metadata were created by and belong to Aristotle University of Thessaloniki Library, Greece and are made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). Unless otherwise stated in the record, the content and copyright of files and fulltext documents belong to their respective authors. Out-of-copyright content that was digitized, converted, processed, modified, etc by AUTh Library, is made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). You are kindly requested to make a reference to AUTh Library and the URL of the record containing the resource whenever you make use of this material.
info:eu-repo/semantics/openAccess



*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.