Σχολή Χρηματοοικονομικής και Στατιστικής. Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης
Εφαρμοσμένη Στατιστική
The subject of this thesis is to investigate possible interactions between variables which are listed in trajectories of moving objects. The data that were used came from a city in Belgium and were collected from two sources, the «data GPS» which are GPS records per user and more specifically from the GPS enabled devices and the «Diaries» in which each user records
the semantic information about the trip. More specifically, in order to achieve our purpose we applied to our data the method of
clustering. We applied the stochastic hierarchical clustering algorithm cumulatively by grouping our data in compact clusters ie based on the maximum square Euclidean distance that these clusters have between them. Three different pairs of clustering were tested and the results that we have reached, indicated that only one pair of these variables correlate quite
well.
Αντικείμενο της παρούσας διπλωματικής εργασίας είναι η διερεύνηση πιθανών αλληλεπιδράσεων μεταξύ μεταβλητών που αναφέρονται σε τροχιές κινούμενων αντικειμένων. Τα δεδομένα που χρησιμοποιήθηκαν προήλθαν από μία πόλη του Βελγίου και συλλέχθηκαν από δύο πηγές δεδομένων, τα «δεδομένα GPS» τα οποία αποτελούν εγγραφές GPS ανά χρήστη και πιο συγκεκριμένα προέρχονται από τις ενεργοποιημένες συσκευές GPS και τα «Ημερολόγια» κίνησης στα οποία κάθε χρήστης καταγράφει τη σημασιολογική πληροφορία για το ταξίδι του. Πιο συγκεκριμένα προκειμένου να επιτευχθεί ο σκοπός μας εφαρμόσαμε στα δεδομένα μας τη μέθοδο της συσταδοποίησης. Εφαρμόσαμε τον στοχαστικό ιεραρχικό αλγόριθμο συσταδοποίησης συσσωρευτικά, ομαδοποιώντας τα δεδομένα μας σε συμπαγείς συστάδες δηλαδή βάση της μέγιστης τετραγωνικής Ευκλείδειας απόστασης που έχουν μεταξύ τους οι συστάδες. Τρία διαφορετικά ζεύγη δοκιμάστηκαν και τα αποτελέσματα στα οποία καταλήξαμε μας έδειξαν ότι μόνο σε ένα από αυτά οι μεταβλητές συσχετίζονται ικανοποιητικά.