Εφαρμογή και υλοποίηση αλγορίθμων μηχανικής μάθησης στην ανάλυση κεμένων

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Εφαρμογή και υλοποίηση αλγορίθμων μηχανικής μάθησης στην ανάλυση κεμένων (EL)
Implementation and creation of machine learning algorithms in text analysis (EN)

Μαυρίκης, Σταμάτης Γ. (EL)
Mavrikis, Stamatis G. (EN)

Λουλάκης, Μιχάλης (EL)
Μέντζας, Γρηγόριος (EL)
Ασκούνης, Δημήτριος (EL)

bachelorThesis

2011-11-21T10:06:38Z
2011-11-21
2011-11-15
2011-11-18


Στόχος της παρούσας διπλωματικής είναι η ανάλυση και η εξέταση του Latent Dirichlet Allocation (LDA), ενός γενετικού αλγορίθμου ανάλυσης κειμένουν, και κάποιων παραλαγών του. Εξετάζουμε την υλοποίηση του απλού LDA και του ιεραρχικού LDA μέσω μίας βιβλιοθήκης, του Mallet, καθώς και υλοποιούμε τον Correlated LDA χρησιμοποιώντας κλάσεις από την ίδια βιβλιοθήκη. Τέλος εφαρμόζουμε τους τρεις αλγορίθμους στο σώμα κειμένων "Polarity Dataset Version 2.0", μία συλλογή επισκοπήσεων ταινιών. (EL)
121 σ. (EL)
Σταμάτης Γ. Μαυρίκης (EL)
In the current thesis, the objective is to analyse Latent Dirichlet Allocatιοn (LDA), a genetic machine learing algorithm in text mining, and some other versions of it as well. We see in depth simple and hierarchical LDA, which have been created in Mallet. We create also an algorithm for Correlated LDA using classes from the same packet. Finaly we implement those algorithm in the text corpus "Polarity Dataset Version 2.0", a collection of movie reviews. (EN)


Σώμα κειμένων (EL)
Ανάλυση κειμένων (EL)
Σημασιολογική ανάλυση (EL)
Επιβλεπόμενο μοντέλο (EL)
Μοντέλα θεμάτων (EL)
HTM (EN)
Text mining (EN)
SLDA (EN)
DLDA (EN)
LDA (EN)
cLDA (EN)
Gibbs (EN)
DTM (EN)
CTM (EN)
Mallet (EN)

Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών. Τομέας Mαθηματικών (EL)

ETDRestricted-policy.xml (EN)




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.