Fine-grained Sentiment Analysis of Multidomain Online Reviews

Το τεκμήριο παρέχεται από τον φορέα :
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών   

Αποθετήριο :
Πέργαμος   

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Fine-grained Sentiment Analysis of Multidomain Online Reviews

Θεοδωρόπουλος Παναγιώτης (EL)
Theodoropoulos Panagiotis (EN)

born_digital_postgraduate_thesis
Διπλωματική Εργασία (EL)
Postgraduate Thesis (EN)

2021


Η Ανάλυση Συναισθήματoς αποτελεί πεδίο εφαρμογών της Υπολογιστικής Γλωσσολογίας και της Τεχνητής Νοημοσύνης όπου, τα τελευταία χρόνια, παρατηρούνται ραγδαίες εξελίξεις στην επιστημονική έρευνα και στην ανάπτυξη συστημάτων. Στην παρούσα προσέγγιση, στοχεύεται η λεπτομερής ανάλυση συναισθήματος σε διαφορετικά είδη διαδικτυακών κριτικών χρηστών. Πρόκειται για τον εντοπισμό και κατηγοριοποίηση περισσοτέρων ειδών δεδομένων που καλύπτουν το φάσμα μεταξύ του «θετικού» και «αρνητικού» πόλου. Συγκεκριμένα, στην παρούσα προσέγγιση και εφαρμογή, η λεπτομερής ανάλυση συναισθήματος πραγματοποιείται με βάση 5 ετικέτες: «αρνητικό», «ελαφρώς αρνητικό», «ουδέτερο», «ελαφρώς θετικό», «θετικό». Επιπλέον, αυτό το λεπτομερές σχήμα ανάλυσης εφαρμόζεται σε τρία διαφορετικά σύνολα δεδομένων: Κριτικές ταινιών, κριτικές του Tripadvisor και κριτικές Coursera μαθημάτων. Χρησιμοποιείται Εποπτευόμενη Μηχανική Μάθηση λόγω του ότι χρησιμοποιεί σύνολα δεδομένων με ετικέτες για αλγόριθμους εκπαίδευσης, έτσι ώστε να μπορούν να χρησιμοποιηθούν αργότερα για ακριβείς προβλέψεις. Όλη η εμπειρία χρήστη επιτυγχάνεται μέσω μιας διαδραστικής εφαρμογής Παγκόσμιου Ιστού, η οποία περιέχει συγκεκριμένα κουμπιά και πλαίσια κειμένου για αλληλεπίδραση με τους λεπτομερείς υπολογισμούς ανάλυσης συναισθήματος. Οι προβλέψεις ταξινόμησης βασίζονται σε 5 (πέντε) διαφορετικούς ταξινομητές: Pytorch Transformer, Multinomial Naïve Bayes, Logistic Regression, Multi-layer Perceptron και Adaboost. Η αξιολόγηση γίνεται με βάση γνωστές μετρικές αξιολόγησης ταξινόμησης. Στη συνέχεια, πραγματοποιείται αναλυτική αξιολόγηση με βάση χειροκίνητα δημιουργημένα δεδομένα, δεδομένα δοκιμών και πραγματικά δεδομένα. (EL)
Sentiment Analysis is a rapidly growing field in the research areas of Artificial Intelligence (AI)-Machine Learning (ML) and Computational Linguistics-Natural Language Processing (NLP). Developments in Sentiment Analysis and Opinion Mining systems are directly connected to developments in Social Media applications, with a constantly expanding variety of user-groups. Targeting to the correct and efficient detection and processing of user responses and human emotions - often in non-specialized texts, Sentiment Analysis and Opinion Mining may be considered a particularly challenging field in Natural Language Processing. The present Thesis concerns Sentiment Analysis implemented at a fine-grained level, beyond the typical polarity of “positive”, “negative” and “neutral” as evaluations of user input. Here, a more rigorous, in-depth processing of user input is targeted. The implemented application is accessed by a web graphical user interface. The text types concerned involve movie reviews, Tripadvisor reviews and Coursera reviews from an English-speaking public and/or English-speaking international public. The classification predictions are based on 5 (five) different classifiers: Pytorch Transformer, Multinomial Naïve Bayes, Logistic Regression, Multi-layer Perceptron and Adaboost. The evaluation is performed based on well-known classification evaluation metrics. Αn exhaustive evaluation, per dataset, is performed, based on manually constructed opinion reviews, test review opinion reviews, and real review opinion reviews. (EN)

Τεχνολογία – Πληροφορική

Τεχνολογία – Πληροφορική (EL)
Technology - Computer science (EN)

Αγγλική γλώσσα

Βιβλιοθήκη και Κέντρο Πληροφόρησης » Βιβλιοθήκη Σχολής Θετικών Επιστημών » Πληροφορική
Σχολή Θετικών Επιστημών » Τμήμα Πληροφορικής & Τηλεπικοινωνιών » ΠΜΣ Τεχνολογίες Πληροφορικής και Επικοινωνιών » Κατεύθυνση Τεχνολογίες Πληροφορικής και Επικοινωνιών

https://creativecommons.org/licenses/by-nc/4.0/




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.