Authorship attribution using distributed document representations

 
Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
Ιδρυματικό Αποθετήριο Ελλάνικος (Hellanicus)
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο





Αναγνώριση συγγραφέα με χρήση κατανεμημένων αναπαραστάσεων κειμένων (EL)
Authorship attribution using distributed document representations (EL)

Κτίστου, Κλέαρχος

aegean

Η κατανεμημένη αναπαράσταση λέξεων σε ένα χώρο διανυσμάτων είναι μια τεχνική που επιτρέπει να αναπαρίστανται λέξεις με τη μέθοδο της γειτνίασης. Οι κατανεμημένες αναπαραστάσεις μπορούν να επεκταθούν σε μεγαλύτερες δομές όπως φράσεις, προτάσεις, έγγραφα. Η ικανότητα κωδικοποίησης πληροφοριών κειμένου και η δυνατότητα χειρισμού δεδομένων μεγάλης διάστασης είναι οι λόγοι για τους οποίους ο τρόπος αυτός χρησιμοποιείται ευρέως σε διάφορες εργασίες επεξεργασίας φυσικών γλωσσών, Σε αυτή την εργασία, προσπαθούμε να κάνουμε την χρήση κατανεμημένης αναπαράστασης σε έγγραφα με σκοπό την εύρεση – ταυτοποίηση του συντάκτη.. Η προτεινόμενη μέθοδος χρησιμοποιεί κατανεμημένες αναπαραστάσεις διανυσμάτων σε έγγραφα και στη συνέχεια χρησιμοποιεί και n-grams για να εκτελέσει την αυτόματη απόδοση σε συγγραφέα. Χρησιμοποιούμε n-grams ως δεδομένα εισόδου για το μοντέλο, πραγματοποιείται έλεγχος σε κείμενα με σκοπό να επαληθεύσουμε το μοντέλο ή ακόμα και να βγάλουμε καλύτερα αποτελέσματα.

masterThesis

αναπαράσταση λέξεων με τη μέθοδο της γειτνίασης (EN)
n-grams (EN)
word recognition (EN)
εύρεση του συντάκτη (EN)
κατανεμημένη αναπαράσταση λέξεων (EN)
doc2vec (EN)


2019-09-26


2020-02-04T11:38:15Z

Σάμος




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.