A longitudinal study of web trackers and their impact to the popularity of websites

This item is provided by the institution :

Repository :
E-Locus Institutional Repository
see the original item page
in the repository's web site and access all digital files if the item*

2018 (EN)
Μια διαχρονική μελέτη των διαδικτυακών ιχνηλατών και τον αντίκτυπό τους στη δημοτικότητα των ιστότοπων
A longitudinal study of web trackers and their impact to the popularity of websites

Δημητριάδης, Ευάγγελος Χ.

Μαρκάτος, Ευάγγελος
Ιωαννίδης, Σωτήρης
Τσακαλίδης, Παναγιώτης

Τα τελευταία χρόνια το περιεχόμενο τρίτων με τη μορφή διαδικτυακών ιχνηλατών έχει γίνει ο ακρογωνιαίος λίθος του διαδικτύου. Οι κίνδυνοι της ιδιωτικότητας που προκύπτουν από την υπερβολική χρήση μηχανισμών παρακολούθησης έχουν επιστήσει την προσοχή της κοινότητας. Σε αυτό το άρθρο πραγματοποιούμε μια μέτρηση μεγάλης κλίμακας για τα τελευταία 7 χρόνια, παρατηρώντας την αύξηση των ιχνηλατών στις κορυφαίες 50.000 ιστοσελίδες σύμφωνα με την λίστα του Alexa. Εξετάζουμε την ανάπτυξη και τη δημοτικότητα του περιεχομένου τρίτων με στόχο τον εντοπισμό των χρηστών στο διαδίκτυο. Επιπλέον, πραγματοποιούμε βαθύτερη ανάλυση σε ιστότοπους που περιέχουν υπερβολικά μεγάλο αριθμό ιχνηλατών. Το σύνολο δεδομένων των τελευταίων επτά ετών συλλέχθηκε από καταχωρήσεις του ιστότοπου archive.org. Χρησιμοποιώντας αυτά τα δεδομένα, εστιάζουμε κυρίως στη σύνδεση μεταξύ του αριθμού των ιχνηλατών και του Alexa Rank της εκάστοτε ιστοσελίδας. Τα αποτελέσματά μας υποδηλώνουν σαφή συσχέτιση μεταξύ του αριθμού των ιχνηλατών και του Alexa Rank. Επαληθεύουμε την αυξημένη χρήση παρακολούθησης από τρίτους στο διαδίκτυο, εκμεταλλευόμενοι γνωστές μαύρες λίστες για να φιλτράρουμε το γενικό περιεχόμενο τρίτων. Επιπλέον, παρατηρούμε την άνοδο των κυρίαρχων ιχνηλατών παράλληλα με τους νέους που προσπαθούν να εμφανιστούν ετησίως σε αυτήν την ταχέως εξελισσόμενη οικονομία του διαδικτύου. Πιστεύουμε ότι αυτή η μελέτη διευκρινίζει και ποσοτικοποιεί το φαινόμενο, παρέχει αποτελέσματα και μετρήσεις της τρέχουσας κατάστασης της ιδιωτικότητας στο διαδίκτυο καθώς και πληροφορίες για το μέλλον της. (EL)
Third party content in the form of web trackers has become a cornerstone of the internet, over the past years. The privacy risks that arise from the excessive use of tracking mechanisms has drawn the attention of the community. In this paper we provide a large-scale measurement over the past 7 years, observing the incremental rise of trackers on Alexa’s top 50K websites. We examine the growth and popularity of third party content that aims to identify users on the web. Furthermore, we perform deeper analysis on websites that contain an overly large number of trackers. Our dataset of the past seven years has been collected from entries of archive.org. Using those datapoints, we mainly focus on the connection between the number of trackers and the website’s Alexa Rank. Our results indicate a clear correlation between the number of trackers and a website’s Alexa Rank. We verify the increased use of third party tracking on the web, taking advantage of well-known blacklists to filter out generic third party content. Moreover, we observe the rise of the dominant trackers alongside the new ones that try to emerge yearly, in the fast moving internet economy. We believe that this study clears the field which regards the quantification of this phenomenon, provides results and measurements of the current state of online privacy, as well as insights for its future. (EN)

Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης

Web trackers
Alexa Rank



Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης

*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)