Ανάπτυξη εργαλείων για αυτόματη εκτίμηση διάθεσης Ελληνικών κειμένων με χρήση Ημι-Επιβλεπόμενων Αναδρομικών Αυτοσυσχετιστών

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Ανάπτυξη εργαλείων για αυτόματη εκτίμηση διάθεσης Ελληνικών κειμένων με χρήση Ημι-Επιβλεπόμενων Αναδρομικών Αυτοσυσχετιστών (EL)

Κοτρότσιος, Κωνσταντίνος (EL)

Διαμαντάρας, Κωνσταντίνος (EL)

masterThesis
Μεταπτυχιακή εργασία (EL)
Master thesis (EN)

2024-10-07T13:49:44Z
2015-07-01
2021-12-13T16:01:40Z


Στην παρούσα μεταπτυχιακή διπλωματική εργασία αναπτύσσονται εργαλεία με σκοπό να χρησιμοποιηθούν σε εφαρμογές αυτόματης εκτίμησης διάθεσης κειμένων στην Ελληνική γλώσσα. Κατασκευάζεται εργαλείο λεξικού της ελληνικής γλώσσας για βάσεις δεδομένων MySQL και Μongodb, το οποίο περιέχει τις λέξεις σε διαφορετικές πτώσεις, αριθμούς, γένη, χρόνους κτλ. Δημιουργείται συλλογή κειμένων από σχόλια χρηστών για προϊόντα τεχνολογίας χαρακτηρισμένα ως προς το συναίσθημα. Αναπτύσσονται εφαρμογές για αυτόματη διόρθωση ορθογραφικών λαθών και λημματοποίησης κειμένων. Γίνεται χρήση μοντέλου ημι-επιβλεπόμενων αναδρομικών αυτοσυσχετιστών, οι οποίοι εκπαιδεύονται να αναπαριστούν τις προτάσεις σε διανυσματικούς χώρους. Η συγκεκριμένη μέθοδος στην αυτόματη εκτίμηση διάθεσης κειμένων έχει υψηλότερες επιδόσεις από άλλες προσεγγίσεις σε ευρέως χρησιμοποιημένες συλλογές. Το μοντέλο εφαρμόζεται στην συλλογή σχολίων που αναπτύξαμε και εξετάζονται τα αποτελέσματα και το πως αυτά επηρεάστηκαν από την εφαρμογή των εργαλείων μας. Με την χρήση των εργαλείων για την προ επεξεργασία των σχολίων βελτιώσαμε τα αποτελέσματα μέχρι και 24% . (EL)
Μεταπτυχιακή Εργασία -- Σχολή Τεχνολογικών Εφαρμογών -- Τμήμα Μηχανικών Πληροφορικής, 2015 (α/α 6977) (EL)
In this master thesis our goal is to develop tools in order to be used in sentiment analysis applications for texts in Greek language. We have developed a Greek language dictionary using MySQL and MongoDB database systems, which contains words in different numbers, genders, tenses etc. A dataset, from users’ opinions about technology products characterized according to sentiment, has been developed. Two applications, one for automatic spelling correction and another for lemmatization have also been developed. A framework of semi-supervised recursive autoencoders, which are trained in vector space representations for multi-word phrases, is used. These representations in automatic assessment of text provision outperform other state-of–the-art approaches on commonly used datasets. This model is applied in on our users’ opinions dataset and the results were examined to see how they were affected by using our tools use, are tested. Using these tools for the pretreatment of the dataset, we have improved the results up to 24%. (EN)


Βαθιά μάθηση (EL)
Ημι-Επιβλεπόμενοι αναδρομικοι αυτοσυσχετιστές (EL)
Αυτόματη εκτίμηση διάθεσης (EL)
Λημματοποίηση (EL)
Semi-supervised Recursive Autoencoders (EN)
Lemmatization (EN)
Sentiment Analysis (EN)
Deep Learning (EN)

Ελληνική γλώσσα

Σχολή Τεχνολογικών Εφαρμογών. Τμήμα Μηχανικών Πληροφορικής (EL)
Τμήμα Μηχανικών Πληροφορικής (EL)

Default License




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.