Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
Πέργαμος
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2020 (EL)

Detecting Hate Speech Online using Machine Learning

ΔΑΝΕΖΗΣ ΑΝΤΩΝΙΟΣ (EL)
DANEZIS ANTONIOS (EN)

Τις δύο τελευταίες δεκαετίες παρατηρήσαμε την ταχεία επέκταση του Διαδικτύου ως πλατφόρμα ανάπτυξης κοινοτήτων. Μεγάλες διαδικτυακές κοινότητες έχουν δημιουργηθεί σε μέσα κοινωνικής δικτύωσης, φόρουμ, πλατφόρμες εκπομπών, εφαρμογές ανταλλαγής μηνυμάτων (chat rooms) και διαδικτυακά βιντεοπαιχνίδια. Ωστόσο, με όλη αυτή την αύξηση της δημοτικότητας αυτών των πλατφορμών, έχει αυξηθεί και η δυσκολία ελέγχου τους. Σε αυτό το άρθρο, θα προτείνουμε πολλαπλά μοντέλα βαθιάς μάθησης που έχουν εκπαιδευτεί σε ένα σύνολο τοξικών σχολίων, θα τα αξιολογήσουμε και θα τα συγκρίνουμε. Λόγω της φύσης του συνόλου δεδομένων μας, τα μοντέλα μας προορίζονται κυρίως για χρήση σε φόρουμ και μέσα κοινωνικής δικτύωσης όπου το μήκος του μηνύματος είναι μεγαλύτερο. Θα μελετήσουμε το σύνολο δεδομένων εκπαίδευσης και θα συζητήσουμε τα προβλήματά του. Τέλος, θα παρουσιάσουμε διαφορετικές τεχνικές προεπεξεργασίας και θα αποφασίσουμε ποιες είναι επωφελείς για τα μοντέλα μας και ποιες είναι επιζήμιες. (EL)
For the past two decades we’ve witnessed rapid growth of the internet as a platform to grow communities. Large online communities have formed on social media, forums, broadcasting platforms, live chats and online video games. However, with all this rise in popularity of these platforms, so has the difficulty of moderating them. In this paper, we’ll propose several deep learning models trained on a toxic comment dataset, evaluate and compare them. Due to the nature of our dataset our models are mostly aimed for use in forums and social media where the message length is longer. We will study the training dataset and discuss its issues. Finally, we will demonstrate different preprocessing techniques and decide which ones are beneficial to our models and which are detrimental. (EN)

born_digital_graduate_thesis
Πτυχιακή Εργασία (EL)
Graduate Thesis (EN)

Τεχνολογία – Πληροφορική (EL)
Technology - Computer science (EN)


Αγγλική γλώσσα

2020





*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.