Αναγνώριση προφίλ συγγραφέα (Author Profiling)

 
Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
Ιδρυματικό Αποθετήριο Ελλάνικος (Hellanicus)
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριοΑναγνώριση προφίλ συγγραφέα (Author Profiling) (EL)

Σφουγγάρη, Ελένη

aegean

Το θέμα της παρούσας εργασίας είναι η αναγνώριση του προφίλ συγγραφέα με μεθόδους μηχανικής μάθησης. Στόχος είναι να μελετηθεί η δυνατότητα αναγνώρισης του φύλου του συγγραφέα θεωρώντας μόνο στυλιστικά χαρακτηριστικά. Στο θεωρητικό μέρος παρουσιάζονται βασικές αρχές της εποπτευόμενης μηχανικής μάθησης και περιγράφεται η διαδικασία της κατηγοριοποίησης κειμένου. Ακολουθεί μια αναφορά στα βασικότερα σημεία του αλγορίθμου διανυσμάτων υποστήριξης και στις κυριότερες μετρικές αξιολόγησης. Τέλος περιγράφονται τα πακέτα και οι βιβλιοθήκες που χρησιμοποιήθηκαν για τη διεκπεραίωση των πειραμάτων της εργασίας και γίνεται μια ανασκόπηση της βιβλιογραφίας Στο πειραματικό μέρος αναπτύσσονται μοντέλα με βάση χαρακτηριστικά σε επίπεδο λέξεων, σε επίπεδο χαρακτήρων και σε συντακτικό επίπεδο. Επίσης μελετάται και ο συνδυασμός των παραπάνω χαρακτηριστικών με τις μεθόδους “early” και “late fusion”. Ολα τα μοντέλα εκπαιδεύονται σε δύο σετ εκπαίδευσης, το “blog authorship corpus” και τη συλλογή εκπαίδευσης από το PAN 2017, χρησιμοποιώντας ως μέθοδο επικύρωσης την “k-fold cross validation”. Στο τελευταίο κεφάλαιο ελέγχονται οι προβλεψεις των μοντέλων που αναπτύχθηκαν σε έξι διαφορετικές συλλογές: blogs, chat, discussion, emails, essays, interviews καθώς και στη συλλογή που προκύπτει από τον συνδυασμό τους με σκοπό να ερευνηθεί η ικανότητα των μοντέλων να εφαρμοστούν σε συλλογές διαφορετικού είδους από αυτό της συλλογής εκπαίδευσης.

bachelorThesis

author profiling (EL)
κατηγοριοποίηση κειμένου (EL)
αναγνώριση προφίλ συγγραφέα (EL)
μηχανική μάθηση (EL)
text classification (EL)
machine learning (EL)


2019-06-11


2020-01-31T12:36:49Z

Σάμος*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.