δείτε την πρωτότυπη σελίδα τεκμηρίου στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
Αναγνώριση συγγραφέα με χρήση κατανεμημένων αναπαραστάσεων κειμένων
(EL)
Authorship attribution using distributed document representations
(EL)
Κτίστου, Κλέαρχος
aegean
Η κατανεμημένη αναπαράσταση λέξεων σε ένα χώρο διανυσμάτων είναι μια τεχνική που επιτρέπει να αναπαρίστανται λέξεις με τη μέθοδο της γειτνίασης. Οι κατανεμημένες αναπαραστάσεις μπορούν να επεκταθούν σε μεγαλύτερες δομές όπως φράσεις, προτάσεις, έγγραφα. Η ικανότητα κωδικοποίησης πληροφοριών κειμένου και η δυνατότητα χειρισμού δεδομένων μεγάλης διάστασης είναι οι λόγοι για τους οποίους ο τρόπος αυτός χρησιμοποιείται ευρέως σε διάφορες εργασίες επεξεργασίας φυσικών γλωσσών,
Σε αυτή την εργασία, προσπαθούμε να κάνουμε την χρήση κατανεμημένης αναπαράστασης σε έγγραφα με σκοπό την εύρεση – ταυτοποίηση του συντάκτη.. Η προτεινόμενη μέθοδος χρησιμοποιεί κατανεμημένες αναπαραστάσεις διανυσμάτων σε έγγραφα και στη συνέχεια χρησιμοποιεί και n-grams για να εκτελέσει την αυτόματη απόδοση σε συγγραφέα.
Χρησιμοποιούμε n-grams ως δεδομένα εισόδου για το μοντέλο, πραγματοποιείται έλεγχος σε κείμενα με σκοπό να επαληθεύσουμε το μοντέλο ή ακόμα και να βγάλουμε καλύτερα αποτελέσματα.
masterThesis
αναπαράσταση λέξεων με τη μέθοδο της γειτνίασης
(EN)
*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.
Βοηθείστε μας να κάνουμε καλύτερο το OpenArchives.gr.