δείτε την πρωτότυπη σελίδα τεκμηρίου στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
Detecting Hate Speech Online using Machine Learning
Τις δύο τελευταίες δεκαετίες παρατηρήσαμε την ταχεία επέκταση του Διαδικτύου ως πλατφόρμα ανάπτυξης κοινοτήτων. Μεγάλες διαδικτυακές κοινότητες έχουν δημιουργηθεί σε μέσα κοινωνικής δικτύωσης, φόρουμ, πλατφόρμες εκπομπών, εφαρμογές ανταλλαγής μηνυμάτων (chat rooms) και διαδικτυακά βιντεοπαιχνίδια. Ωστόσο, με όλη αυτή την αύξηση της δημοτικότητας αυτών των πλατφορμών, έχει αυξηθεί και η δυσκολία ελέγχου τους. Σε αυτό το άρθρο, θα προτείνουμε πολλαπλά μοντέλα βαθιάς μάθησης που έχουν εκπαιδευτεί σε ένα σύνολο τοξικών σχολίων, θα τα αξιολογήσουμε και θα τα συγκρίνουμε. Λόγω της φύσης του συνόλου δεδομένων μας, τα μοντέλα μας προορίζονται κυρίως για χρήση σε φόρουμ και μέσα κοινωνικής δικτύωσης όπου το μήκος του μηνύματος είναι μεγαλύτερο. Θα μελετήσουμε το σύνολο δεδομένων εκπαίδευσης και θα συζητήσουμε τα προβλήματά του. Τέλος, θα παρουσιάσουμε διαφορετικές τεχνικές προεπεξεργασίας και θα αποφασίσουμε ποιες είναι επωφελείς για τα μοντέλα μας και ποιες είναι επιζήμιες.
(EL)
For the past two decades we’ve witnessed rapid growth of the internet as a platform
to grow communities. Large online communities have formed on social media, forums,
broadcasting platforms, live chats and online video games. However, with all this rise
in popularity of these platforms, so has the difficulty of moderating them. In this paper,
we’ll propose several deep learning models trained on a toxic comment dataset, evaluate
and compare them. Due to the nature of our dataset our models are mostly aimed for
use in forums and social media where the message length is longer. We will study the
training dataset and discuss its issues. Finally, we will demonstrate different preprocessing
techniques and decide which ones are beneficial to our models and which are detrimental.
(EN)
Τεχνολογία – Πληροφορική
(EL)
Technology - Computer science
(EN)
Αγγλική γλώσσα
*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.
Βοηθείστε μας να κάνουμε καλύτερο το OpenArchives.gr.