Αναγνώριση ρητορικής μίσους στα μέσα κοινωνικής δικτύωσης

 
Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
Ιδρυματικό Αποθετήριο Ελλάνικος (Hellanicus)
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο



Αναγνώριση ρητορικής μίσους στα μέσα κοινωνικής δικτύωσης (EL)

Κατρίνης, Δημήτριος

aegean

Το φαινόμενο της ρητορικής μίσους έχει πάρει μεγάλες διαστάσεις ειδικά τα τελευταία χρόνια, όντας απότοκο της παγκόσμιας κοινωνικής και οικονομικής κρίσης, που οδήγησε στην ριζοσπαστικοποίηση ατόμων και κοινωνικών ομάδων και ανάδειξη ακραίων/λαϊκίστικων ρητορικών και συμπεριφορών. Ειδικά, στο διαδίκτυο και πιο συγκεκριμένα στα μέσα κοινωνικής δικτύωσης το φαινόμενο αυτό γιγαντώνεται, αφού το πολυπληθές κοινό τους, η άμεση διακίνηση της πληροφορίας, και το χαρακτηριστικό της ανωνυμίας που αυτά διασφαλίζουν, το καθιστούν εξαιρετικά επικίνδυνο για την διαταραχή της κοινωνικής συνοχής, για ψυχολογική επιβάρυνση των ομάδων ή και μεμονωμένων προσώπων στα οποία απευθύνεται, αλλά και σαν παράγοντα υποκίνησης πράξεων βίας. Προκειμένου να διατηρήσουν την φερεγγυότητα και την αξιοπιστία τους, αρκετά μέσα κοινωνικής δικτύωσης προσπαθούν να απομονώσουν φαινόμενα ρητορικής μίσους θέτοντας όρους αρχικά στην πολιτική χρήσης τους, αλλά και χρησιμοποιώντας εργατικό δυναμικό για την ανίχνευση κακόβουλων μηνυμάτων/σχολίων και τη διαγραφή τους. Όσο όμως η χρήση τους αυξάνει γεωμετρικά, τέτοιες πρακτικές καθίστανται ανεπαρκείς, οπότε είναι επιτακτική η ανάπτυξη μεθόδων αυτόματης ανίχνευσης ρητορικής μίσους. Στην προσπάθεια αυτή πολύτιμος αρωγός είναι ο τομέας της Τεχνητής Νοημοσύνης διαμέσου μεθόδων Μηχανικής Μάθησης. Στον τομέα αυτό η παγκόσμια επιστημονική κοινότητα συμβάλει ώστε να αναπτυχθούν σχετικά μοντέλα και να αναδειχθούν τα βέλτιστα ως προς την ανίχνευση της ρητορικής μίσους. Η παρούσα διπλωματική εργασία έχει ως στόχο να αναλύσει το φαινόμενο αυτό, να αναδείξει προβλήματα που ανακύπτουν κατά την εφαρμογή τεχνικών μηχανικής μάθησης και να μελετήσει και να συγκρίνει μοντέλα μηχανικής μάθησης για την κατηγοριοποίηση μηνυμάτων ρητορικής μίσους χρησιμοποιώντας σύνολα δεδομένων από το κοινωνικό μέσο Twitter. Σύμφωνα με τα ευρήματα διαπιστώνεται ότι η Λογιστική Παλινδρόμηση αποτελεί τη βέλτιστη μέθοδο ταξινόμησης, σε σύγκριση με τους λοιπούς στατιστικούς ταξινομητές που δοκιμάστηκαν πειραματικά. Επίσης, τα πειραματικά ευρήματα αξιολογούν την επιρροή συγκεκριμένων κλάσεων γνωρισμάτων κειμένου στην επίλυση του προβλήματος, με κύρια ευρήματα την υπεροχή των n-grams λέξεων κατά την προεπεξεργασία και την μικρή συνεισφορά της ανάλυσης συναισθήματος ως γνωρίσματος. Εστιάζοντας στην κατηγοριοποίηση μηνυμάτων της κλάσης μίσους μόνον, η παρούσα διπλωματική αναδεικνύει - τόσο σε βιβλιογραφικό επίπεδο όσο και πειραματικά - ότι περαιτέρω βήματα απαιτούνται για την πλήρη και αξιόπιστη αυτοματοποίηση της εν λόγω διεργασίας μηχανικής μάθησης (machine learning task). Τα διαθέσιμα ανοικτά σύνολα δεδομένων που τροφοδοτούν τα μοντέλα εμφανίζουν μεγάλη ανομοιογένεια ως προς τις κλάσεις. Τούτο, σε συνδυασμό με το ότι η υβριστική – προσβλητική γλώσσα συχνά δεν είναι εύκολο να διαχωριστεί από τη ρητορική μίσους, καθιστά τους παραδοσιακούς ταξινομητές που βασίζονται σε στατιστικά μοντέλα να έχουν σχετικά χαμηλή αποτελεσματικότητα ως προς την σωστή ταξινόμηση των μηνυμάτων μίσους, αν και δίνουν αρκετά καλά αποτελέσματα γενικά κατά την ταξινόμηση (μετρικές που περιλαμβάνουν όλες τις κλάσεις). Επίσης απαιτείται πιο ενδελεχής μελέτη κατά την εξαγωγή των γνωρισμάτων με βάρος στην ανάδειξη σημασιολογικών χαρακτηριστικών.

masterThesis

ρητορική μίσους (EL)
ταξινόμηση (EL)
κατηγοριοποίηση κειμένου (EL)
μηχανική μάθηση (EL)
text categorization (EL)
hate speech (EL)
machine learning (EL)
classification (EL)
τεχνητή νοημοσύνη (EL)
artificial intelligence (EL)


2020-02


2020-02-13T12:46:11Z

Σάμος



*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.