A longitudinal study of web trackers and their impact to the popularity of websites

 
Το τεκμήριο παρέχεται από τον φορέα :
Πανεπιστήμιο Κρήτης
Αποθετήριο :
E-Locus Ιδρυματικό Καταθετήριο
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2018 (EL)
Μια διαχρονική μελέτη των διαδικτυακών ιχνηλατών και τον αντίκτυπό τους στη δημοτικότητα των ιστότοπων
A longitudinal study of web trackers and their impact to the popularity of websites

Δημητριάδης, Ευάγγελος Χ.

Μαρκάτος, Ευάγγελος
Ιωαννίδης, Σωτήρης
Τσακαλίδης, Παναγιώτης

Τα τελευταία χρόνια το περιεχόμενο τρίτων με τη μορφή διαδικτυακών ιχνηλατών έχει γίνει ο ακρογωνιαίος λίθος του διαδικτύου. Οι κίνδυνοι της ιδιωτικότητας που προκύπτουν από την υπερβολική χρήση μηχανισμών παρακολούθησης έχουν επιστήσει την προσοχή της κοινότητας. Σε αυτό το άρθρο πραγματοποιούμε μια μέτρηση μεγάλης κλίμακας για τα τελευταία 7 χρόνια, παρατηρώντας την αύξηση των ιχνηλατών στις κορυφαίες 50.000 ιστοσελίδες σύμφωνα με την λίστα του Alexa. Εξετάζουμε την ανάπτυξη και τη δημοτικότητα του περιεχομένου τρίτων με στόχο τον εντοπισμό των χρηστών στο διαδίκτυο. Επιπλέον, πραγματοποιούμε βαθύτερη ανάλυση σε ιστότοπους που περιέχουν υπερβολικά μεγάλο αριθμό ιχνηλατών. Το σύνολο δεδομένων των τελευταίων επτά ετών συλλέχθηκε από καταχωρήσεις του ιστότοπου archive.org. Χρησιμοποιώντας αυτά τα δεδομένα, εστιάζουμε κυρίως στη σύνδεση μεταξύ του αριθμού των ιχνηλατών και του Alexa Rank της εκάστοτε ιστοσελίδας. Τα αποτελέσματά μας υποδηλώνουν σαφή συσχέτιση μεταξύ του αριθμού των ιχνηλατών και του Alexa Rank. Επαληθεύουμε την αυξημένη χρήση παρακολούθησης από τρίτους στο διαδίκτυο, εκμεταλλευόμενοι γνωστές μαύρες λίστες για να φιλτράρουμε το γενικό περιεχόμενο τρίτων. Επιπλέον, παρατηρούμε την άνοδο των κυρίαρχων ιχνηλατών παράλληλα με τους νέους που προσπαθούν να εμφανιστούν ετησίως σε αυτήν την ταχέως εξελισσόμενη οικονομία του διαδικτύου. Πιστεύουμε ότι αυτή η μελέτη διευκρινίζει και ποσοτικοποιεί το φαινόμενο, παρέχει αποτελέσματα και μετρήσεις της τρέχουσας κατάστασης της ιδιωτικότητας στο διαδίκτυο καθώς και πληροφορίες για το μέλλον της. (EL)
Third party content in the form of web trackers has become a cornerstone of the internet, over the past years. The privacy risks that arise from the excessive use of tracking mechanisms has drawn the attention of the community. In this paper we provide a large-scale measurement over the past 7 years, observing the incremental rise of trackers on Alexa’s top 50K websites. We examine the growth and popularity of third party content that aims to identify users on the web. Furthermore, we perform deeper analysis on websites that contain an overly large number of trackers. Our dataset of the past seven years has been collected from entries of archive.org. Using those datapoints, we mainly focus on the connection between the number of trackers and the website’s Alexa Rank. Our results indicate a clear correlation between the number of trackers and a website’s Alexa Rank. We verify the increased use of third party tracking on the web, taking advantage of well-known blacklists to filter out generic third party content. Moreover, we observe the rise of the dominant trackers alongside the new ones that try to emerge yearly, in the fast moving internet economy. We believe that this study clears the field which regards the quantification of this phenomenon, provides results and measurements of the current state of online privacy, as well as insights for its future. (EN)

text
Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης

Διαδίκτυο
Ιχνηλάτες
Web trackers
Alexa Rank

Πανεπιστήμιο Κρήτης (EL)
University of Crete (EN)

Αγγλική γλώσσα

2018-03-23


Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης



*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.