Τα μέσα κοινωνικής δικτύωσης έχουν μεταμορφώσει τον τρόπο με τον οποίο
οι άνθρωποι αλληλεπιδρούν, μοιράζονται πληροφορίες και εκφράζουν απόψεις,
ωστόσο έχουν εισάγει σημαντικές προκλήσεις, ιδίως την αύξηση της συμπερι-
φοράς τρολαρίσματος. Το τρολάρισμα περιλαμβάνει τη δημοσίευση μηνυμάτων
με καυστικό λόγο, μηνυμάτων που έχουν σκοπό να διαταρράξουν τον διαδι-
κτυακό διάλογο, που διαδίδουν παραπληροφόρηση και καλλιεργούν ένα τοξικό
περιβάλλον. Η παρούσα διπλωματική εργασία ασχολείται με την δημιουργία με-
θόδων ανίχνευσης τρολ χρησιμοποιώντας τεχνικές τεχνητής νοημοσύνης (AI)
και της επεξεργασίας φυσικής γλώσσας (NLP).
Η ανίχνευση τρολ προσεγγίζεται μέσω της τεχνικής text classification, η οποία
κατηγοριοποιεί περιεχόμενο από τα μέσα κοινωνικής δικτύωσης ως τρολ και μη
τρολ χρησιμοποιώντας διάφορους αλγορίθμους μηχανικής μάθησης. Η παρούσα
εργασία συγκρίνει τις τεχνικές Logistic Regression, Naive Bayes, SVM και το
pre - trained μοντέλο DeBERTa. Τα αποτελέσματα δείχνουν ότι το μοντέλο
DeBERTa υπερτερεί των άλλων μεθόδων, αξιολογώντας την απόδοσή τους με
τις μετρικές accuracy, precision, F1-score, και recall.
Επιπλέον, η παρούσα έρευνα εξετάζει τις δυνατότητες γενίκευσης του μοντέλου
DeBERTa, δοκιμάζοντάς το σε άγνωστα δεδομένα από διαφορετικές πηγές μέσω
προβλέψεων. Το μοντέλο παρουσιάζει ικανοποιητικές επιδόσεις σε zero-shot
predictions και ακριβείς σε one-shot predictions.
Η τελική φάση επικεντρώνεται στην ανάπτυξη ενός γενικού μοντέλου που προ-
βλέπει με ακρίβεια τη συμπεριφορά του τρολαρίσματος σε διαφορετικά σύνολα
δεδομένων με διαφορετικούς τύπους τρολ. Εφαρμόζεται Scale-invariant FineTuning (SiFT) για τη βελτίωση των επιδόσεων του μοντέλου και παρουσιάζεται σημαντική βελτίωση.
(EL)
Social networks have transformed the way people interact, share information, and
express opinions; however, they have introduced significant challenges, notably
the rise of trolling behavior. Trolling involves posting inflammatory or disruptive
messages that degrade online discourse, spread misinformation, and foster a toxic
environment. This thesis addresses the challenge of troll detection using artificial
intelligence (AI) and natural language processing (NLP) techniques.
Troll detection is approached through text classification, which distinguishes between troll and non-troll content using various machine learning algorithms. This
study compares Logistic Regression, Naive Bayes, SVM, and the pre-trained DeBERTa model. The results show that DeBERTa outperforms the other methods in
terms of accuracy, precision, F1-score, and recall.
Furthermore, the thesis examines the generalization capabilities of the DeBERTa
model by testing it on unseen data from different sources through zero-shot and
one-shot predictions. The model shows satisfactory performance in zero-shot predictions and good results in one-shot predictions.
The final phase focuses on developing a general model that accurately predicts
trolling behavior across different datasets. Scale-invariant fine-tuning (SiFT) was
applied to improve the model’s performance and showed significant improvement.
(EN)