Η Ανάλυση Συναισθήματoς αποτελεί πεδίο εφαρμογών της Υπολογιστικής Γλωσσολογίας και της Τεχνητής Νοημοσύνης όπου, τα τελευταία χρόνια, παρατηρούνται ραγδαίες εξελίξεις στην επιστημονική έρευνα και στην ανάπτυξη συστημάτων. Στην παρούσα προσέγγιση, στοχεύεται η λεπτομερής ανάλυση συναισθήματος σε διαφορετικά είδη διαδικτυακών κριτικών χρηστών. Πρόκειται για τον εντοπισμό και κατηγοριοποίηση περισσοτέρων ειδών δεδομένων που καλύπτουν το φάσμα μεταξύ του «θετικού» και «αρνητικού» πόλου. Συγκεκριμένα, στην παρούσα προσέγγιση και εφαρμογή, η λεπτομερής ανάλυση συναισθήματος πραγματοποιείται με βάση 5 ετικέτες: «αρνητικό», «ελαφρώς αρνητικό», «ουδέτερο», «ελαφρώς θετικό», «θετικό». Επιπλέον, αυτό το λεπτομερές σχήμα ανάλυσης εφαρμόζεται σε τρία διαφορετικά σύνολα δεδομένων: Κριτικές ταινιών, κριτικές του Tripadvisor και κριτικές Coursera μαθημάτων. Χρησιμοποιείται Εποπτευόμενη Μηχανική Μάθηση λόγω του ότι χρησιμοποιεί σύνολα δεδομένων με ετικέτες για αλγόριθμους εκπαίδευσης, έτσι ώστε να μπορούν να χρησιμοποιηθούν αργότερα για ακριβείς προβλέψεις.
Όλη η εμπειρία χρήστη επιτυγχάνεται μέσω μιας διαδραστικής εφαρμογής Παγκόσμιου Ιστού, η οποία περιέχει συγκεκριμένα κουμπιά και πλαίσια κειμένου για αλληλεπίδραση με τους λεπτομερείς υπολογισμούς ανάλυσης συναισθήματος.
Οι προβλέψεις ταξινόμησης βασίζονται σε 5 (πέντε) διαφορετικούς ταξινομητές: Pytorch Transformer, Multinomial Naïve Bayes, Logistic Regression, Multi-layer Perceptron και Adaboost. Η αξιολόγηση γίνεται με βάση γνωστές μετρικές αξιολόγησης ταξινόμησης. Στη συνέχεια, πραγματοποιείται αναλυτική αξιολόγηση με βάση χειροκίνητα δημιουργημένα δεδομένα, δεδομένα δοκιμών και πραγματικά δεδομένα.
(EL)
Sentiment Analysis is a rapidly growing field in the research areas of Artificial Intelligence (AI)-Machine Learning (ML) and Computational Linguistics-Natural Language Processing (NLP). Developments in Sentiment Analysis and Opinion Mining systems are directly connected to developments in Social Media applications, with a constantly expanding variety of user-groups. Targeting to the correct and efficient detection and processing of user responses and human emotions - often in non-specialized texts, Sentiment Analysis and Opinion Mining may be considered a particularly challenging field in Natural Language Processing.
The present Thesis concerns Sentiment Analysis implemented at a fine-grained level, beyond the typical polarity of “positive”, “negative” and “neutral” as evaluations of user input. Here, a more rigorous, in-depth processing of user input is targeted. The implemented application is accessed by a web graphical user interface. The text types concerned involve movie reviews, Tripadvisor reviews and Coursera reviews from an English-speaking public and/or English-speaking international public.
The classification predictions are based on 5 (five) different classifiers: Pytorch Transformer, Multinomial Naïve Bayes, Logistic Regression, Multi-layer Perceptron and Adaboost. The evaluation is performed based on well-known classification evaluation metrics. Αn exhaustive evaluation, per dataset, is performed, based on manually constructed opinion reviews, test review opinion reviews, and real review opinion reviews.
(EN)