Εποπτεία γεωγραφικής κάλυψης συζητήσεων σε κοινωνικά δίκτυα

see the original item page
in the repository's web site and access all digital files if the item*



Εποπτεία γεωγραφικής κάλυψης συζητήσεων σε κοινωνικά δίκτυα (EL)

Λουκαδάκης, Εμμανουήλ (EL)
Loukadakis, Emmanouil (EN)

Βασιλείου, Ιωάννης (EL)
Θεοδωρίδης, Ιωάννης (EL)
ntua (EL)
Κοζύρης, Νεκτάριος (EL)

bachelorThesis

2016-04-08
2016-10-11T05:56:29Z
2016-10-11


Αντικείμενο της διπλωματικής εργασίας είναι η ανάπτυξη ενός αλγορίθμου για την ανίχνευση δημοφιλών συζήτησεων που εκτυλίσσονται στα κοινωνικά δίκτυα, καθώς και για την εποπτεία της γεωγραφικής τους κάλυψης με την πάροδο του χρόνου. Συγκεκριμένα, η μελέτη επικεντρώθηκε στο κοινωνικό δίκτυο Twitter, καθώς τα σχετικά μηνύματα δημοσιεύονται με πολύ γρήγορο ρυθμό, επομένως θεωρείται ότι συγκροτούν ένα ρεύμα δεδομένων. ́Οταν διαδραματίζεται ένα γεγονός (λ.χ. ποδοσφαιρικός αγώνας, διαδήλωση, συναυλία), οι χρήστες των κοινωνικών δικτύων έχουν την τάση να δημοσιεύουν μηνύματα και να συζητούν σχετικά με αυτό. Τέτοια γεγονότα μπορούν να χαρακτηριστούν ως δημοφιλείς συζητήσεις και τα σχετικά μηνύματα στο Twitter συνήθως συνοδεύονται από χαρακτηριστικές ετικέτες. Πολλές φορές, μία τέτοια συζήτηση είναι δημοφιλής μόνο κατά τόπους, υποθέτοντας βέβαια ότι είναι γνωστή η γεωγραφική θέση των χρηστών που συμμετέχουν σ ́ αυτήν. Στην παρούσα διπλωματική εργασία, μελετάμε την εξέλιξη τέτοιων συζητήσεων στον χώρο και στον χρόνο, ανανεώνοντας τις περιοχές επιρροής τους σε πραγματικό χρόνο. Παρακολουθώντας τις μεταβολές στην γεωγραφική κάλυψη τέτοιων φαινομένων, μπορούμε να εξάγουμε χρήσιμα συμπεράσματα σχετικά με την ένταση κάθε φαινομένου και τον αντίκτυπο που έχει στην κοινωνία. Η εργασία επικεντρώνεται κυρίως στην ανάπτυξη τεχνικών για ανίχνευση συζητήσεων, προσδιορισμό των πιο δημοφιλών από αυτές και εποπτεία της γεωγραφικής κάλυψής τους. Ο αλγόριθμος είναι επίτηδες προσεγγιστικός ως προς την εκτίμηση της γεωγραφικής κάλυψης των δημοφιλών συζητήσεων, στοχεύοντας σε βελτιωμένες επιδόσεις ως προς τον χρόνο εκτέλεσης. Πειραματική μελέτη σε πραγματικά δεδομένα από το Twitter για την ευρύτερη περιοχή του Λονδίνου, επιβεβαίωσε ότι η προτεινόμενη μεθοδολογία είναι ικανή να αντιμετωπίσει κλιμακούμενους όγκους μηνυμάτων για διάφορες τιμές παραμέτρων επιστρέφοντας εκτιμήσεις καλής ποιότητας. Ως γενικό συμπέρασμα της εργασίας μπορεί να ειπωθεί ότι ο αλγόριθμος είναι κατάλληλος για ανίχνευση της χωρικής κάλυψης τέτοιων συζητήσεων, θυσιάζοντας την ακρίβεια προς όφελος της έγκαιρης απόκρισης. (EL)
The purpose of this diploma thesis is to develop an algorithm for detection of popular topics unfolding in social networks, as well as for monitoring their spatial coverage through time. We particularly focus our study on Twitter, mainly because the posting rate of such messages is extremely high, so they can be considered as a data stream. When an event (e.g., a match, a demonstration, or a concert) is ongoing, many users tend to post messages referring to that event in social networks. Essentially, this creates a discussion over the same topic, which is usually characterized by hashtag(s). Sometimes, such a topic may be popular only locally, assuming that related posts have a geographical reference, which represents the location where the user posted the message. In this diploma thesis, we study how trending topics evolve both in space and time, updating the corresponding local areas in real time. Observing the evolving spatial coverage of such posts may reveal the intensity of the phenomenon and its impact on local communities. This thesis mainly focuses on developing efficient methods for topic detection, identification of trending topics and monitoring their spatial coverage, aiming at significant reduction in processing costs. The suggested algorithm is deliberately chosen to be approximate with respect to the calculation of spatial coverages. An experimental study was conducted against real-world data from Twitter concerning the greater area of London. These tests confirmed that the proposed methodology is able to perform against scalable volumes of data under various parameter settings and can also yield good-quality results. The overall conclusion of this thesis is that the algorithm is suitable for real time detection of the spatial footprint of evolving topics, where some accuracy may be sacrificed for the benefit of timely response. (EN)


Μηνύματα με γεωγραφικό στίγμα (EL)
Χωρική κάλυψη (EL)
Ρεύματα δεδομένων (EL)
Κοινωνικά δίκτυα (EL)
Δημοφιλείς συζητήσεις (EL)
Geottaged messages (EN)
Social networks (EN)
Data streams (EN)
Spatial coverage (EN)
Popular topics (EN)

Greek

Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Συστημάτων Βάσεων Γνώσεων και Δεδομένων (EL)

Default License




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)