Social media analysis targeting Troll detection

This item is provided by the institution :
Technical University of Crete   

Repository :
Institutional Repository Technical University of Crete   

see the original item page
in the repository's web site and access all digital files if the item*



Ανάλυση μέσων κοινωνικής δικτύωσης εστιασμένης στην ανίχνευση Troll (EL)
Social media analysis targeting Troll detection (EN)

Κουτρα Παναγιωτα (EL)
Koutra Panagiota (EN)

Ιωαννιδης Σωτηριος (EL)
Σπυροπουλος Θρασυβουλος (EL)
Λαγουδακης Μιχαηλ (EL)
Ioannidis Sotirios (EN)
Lagoudakis Michail (EN)
Spyropoulos Thrasyvoulos (EN)

bachelorThesis

2024


Τα μέσα κοινωνικής δικτύωσης έχουν μεταμορφώσει τον τρόπο με τον οποίο οι άνθρωποι αλληλεπιδρούν, μοιράζονται πληροφορίες και εκφράζουν απόψεις, ωστόσο έχουν εισάγει σημαντικές προκλήσεις, ιδίως την αύξηση της συμπερι- φοράς τρολαρίσματος. Το τρολάρισμα περιλαμβάνει τη δημοσίευση μηνυμάτων με καυστικό λόγο, μηνυμάτων που έχουν σκοπό να διαταρράξουν τον διαδι- κτυακό διάλογο, που διαδίδουν παραπληροφόρηση και καλλιεργούν ένα τοξικό περιβάλλον. Η παρούσα διπλωματική εργασία ασχολείται με την δημιουργία με- θόδων ανίχνευσης τρολ χρησιμοποιώντας τεχνικές τεχνητής νοημοσύνης (AI) και της επεξεργασίας φυσικής γλώσσας (NLP). Η ανίχνευση τρολ προσεγγίζεται μέσω της τεχνικής text classification, η οποία κατηγοριοποιεί περιεχόμενο από τα μέσα κοινωνικής δικτύωσης ως τρολ και μη τρολ χρησιμοποιώντας διάφορους αλγορίθμους μηχανικής μάθησης. Η παρούσα εργασία συγκρίνει τις τεχνικές Logistic Regression, Naive Bayes, SVM και το pre - trained μοντέλο DeBERTa. Τα αποτελέσματα δείχνουν ότι το μοντέλο DeBERTa υπερτερεί των άλλων μεθόδων, αξιολογώντας την απόδοσή τους με τις μετρικές accuracy, precision, F1-score, και recall. Επιπλέον, η παρούσα έρευνα εξετάζει τις δυνατότητες γενίκευσης του μοντέλου DeBERTa, δοκιμάζοντάς το σε άγνωστα δεδομένα από διαφορετικές πηγές μέσω προβλέψεων. Το μοντέλο παρουσιάζει ικανοποιητικές επιδόσεις σε zero-shot predictions και ακριβείς σε one-shot predictions. Η τελική φάση επικεντρώνεται στην ανάπτυξη ενός γενικού μοντέλου που προ- βλέπει με ακρίβεια τη συμπεριφορά του τρολαρίσματος σε διαφορετικά σύνολα δεδομένων με διαφορετικούς τύπους τρολ. Εφαρμόζεται Scale-invariant FineTuning (SiFT) για τη βελτίωση των επιδόσεων του μοντέλου και παρουσιάζεται σημαντική βελτίωση. (EL)
Social networks have transformed the way people interact, share information, and express opinions; however, they have introduced significant challenges, notably the rise of trolling behavior. Trolling involves posting inflammatory or disruptive messages that degrade online discourse, spread misinformation, and foster a toxic environment. This thesis addresses the challenge of troll detection using artificial intelligence (AI) and natural language processing (NLP) techniques. Troll detection is approached through text classification, which distinguishes between troll and non-troll content using various machine learning algorithms. This study compares Logistic Regression, Naive Bayes, SVM, and the pre-trained DeBERTa model. The results show that DeBERTa outperforms the other methods in terms of accuracy, precision, F1-score, and recall. Furthermore, the thesis examines the generalization capabilities of the DeBERTa model by testing it on unseen data from different sources through zero-shot and one-shot predictions. The model shows satisfactory performance in zero-shot predictions and good results in one-shot predictions. The final phase focuses on developing a general model that accurately predicts trolling behavior across different datasets. Scale-invariant fine-tuning (SiFT) was applied to improve the model’s performance and showed significant improvement. (EN)


Troll detection (EN)
Machine learning (EN)
DeBERTa (EN)
Natural language processing (EN)
Text classification (EN)

English

Πολυτεχνείο Κρήτης (EL)
Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών (EL)
Technical University of Crete (EN)
Technical University of Crete::School of Electrical and Computer Engineering (EN)




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)