Implementation and creation of machine learning algorithms in text analysis

see the original item page
in the repository's web site and access all digital files if the item*



Εφαρμογή και υλοποίηση αλγορίθμων μηχανικής μάθησης στην ανάλυση κεμένων (EL)
Implementation and creation of machine learning algorithms in text analysis (EN)

Μαυρίκης, Σταμάτης Γ. (EL)
Mavrikis, Stamatis G. (EN)

Λουλάκης, Μιχάλης (EL)
Μέντζας, Γρηγόριος (EL)
Ασκούνης, Δημήτριος (EL)

bachelorThesis

2011-11-21T10:06:38Z
2011-11-21
2011-11-15
2011-11-18


Στόχος της παρούσας διπλωματικής είναι η ανάλυση και η εξέταση του Latent Dirichlet Allocation (LDA), ενός γενετικού αλγορίθμου ανάλυσης κειμένουν, και κάποιων παραλαγών του. Εξετάζουμε την υλοποίηση του απλού LDA και του ιεραρχικού LDA μέσω μίας βιβλιοθήκης, του Mallet, καθώς και υλοποιούμε τον Correlated LDA χρησιμοποιώντας κλάσεις από την ίδια βιβλιοθήκη. Τέλος εφαρμόζουμε τους τρεις αλγορίθμους στο σώμα κειμένων "Polarity Dataset Version 2.0", μία συλλογή επισκοπήσεων ταινιών. (EL)
121 σ. (EL)
Σταμάτης Γ. Μαυρίκης (EL)
In the current thesis, the objective is to analyse Latent Dirichlet Allocatιοn (LDA), a genetic machine learing algorithm in text mining, and some other versions of it as well. We see in depth simple and hierarchical LDA, which have been created in Mallet. We create also an algorithm for Correlated LDA using classes from the same packet. Finaly we implement those algorithm in the text corpus "Polarity Dataset Version 2.0", a collection of movie reviews. (EN)


Σώμα κειμένων (EL)
Ανάλυση κειμένων (EL)
Σημασιολογική ανάλυση (EL)
Επιβλεπόμενο μοντέλο (EL)
Μοντέλα θεμάτων (EL)
HTM (EN)
Text mining (EN)
SLDA (EN)
DLDA (EN)
LDA (EN)
cLDA (EN)
Gibbs (EN)
DTM (EN)
CTM (EN)
Mallet (EN)

Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών. Τομέας Mαθηματικών (EL)

ETDRestricted-policy.xml (EN)




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)