Αναγνώριση συγγραφέα με αναπαράσταση κειμένων στο τανυστικό χώρο 2ης τάξης

see the original item page
in the repository's web site and access all digital files if the item*



Αναγνώριση συγγραφέα με αναπαράσταση κειμένων στο τανυστικό χώρο 2ης τάξης

Πλακιάς, Σπυριδων

Σταματάτος, Ευστάθιος

masterThesis

2008
2015-11-18T10:40:07Z


Η μεγάλη πλειοψηφία της έρευνας στην κατηγοριοποίηση κειμένων χρησιμοποιεί το διανυσματικό χώρο για να αναπαραστήσει τα κείμενα. Σε αυτό την εργασία, προτείνετε η χρήση τανυστών δεύτερης τάξης για την αναπαράσταση των κειμένων. Με βάση μια τροποποίηση του αλγορίθμου SVM, αποκαλούμενη tensor space machine(STM), ερευνούνται διάφοροι μέθοδοι για την μορφή του τανυστή δεύτερης τάξης(πίνακα), λαμβάνοντας υπόψη ότι τα παρόμοια χαρακτηριστικά γνωρίσματα πρέπει να τοποθετούνται στην ίδια γειτονιά του πίνακα. Οι προτεινόμενες μέθοδοι εφαρμόζονται στο πρόβλημα αναγνώρισης συγγραφέα, χρησιμοποιώντας σαν χαρακτηριστικά γνωρίσματα 3grams τα οποία και εξάγονται από το σύνολο των κειμένων εκπαίδευσης. Η σύγκριση του STM με SVM δείχνει την αποτελεσματικότητα των προτεινόμενων δομών όταν ο αριθμός των κειμένων εκπαίδευσης είναι μικρός, κάτι το οποίο συμβαίνει σε εφαρμογές του πραγματικού κόσμου.

Algorithms
Computational linguistics

Tensor space
Τανυστικός χώρος
Αναγνώριση συγγραφέα
Author identification

Πανεπιστήμιο Αιγαίου. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων. Τεχνολογίες και Διοίκηση Πληροφοριακών και Επικοινωνιακών Συστημάτων.




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)