Out-of-core data clustering with sparsified k-means algorithm in MATLAB environment for TMG library

Το τεκμήριο παρέχεται από τον φορέα :
Πανεπιστήμιο Πατρών   

Αποθετήριο :
Νημερτής   

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Out-of-core συσταδοποίηση δεδομένων με τον αλγόριθμο sparsified k-means σε περιβάλλον MATLAB στην εργαλειοθήκη TMG
Out-of-core data clustering with sparsified k-means algorithm in MATLAB environment for TMG library

Κορυφίδης, Γεώργιος

Koryfidis, Georgios

2024-11-07T06:04:05Z
2024-10-23


την παρούσα διπλωματική διατριβή μας απασχολεί η χρήση μεθόδων συσταδοποίησης ακόμα και για δεδομένα μεγάλου όγκου στο περιβάλλον της MATLAB όπου είναι αδύνατη η χρήση του k-means του Text Analytics Toolbox. Εξετάζουμε διαφορετικούς αλγορίθμους και υλοποιήσεις και ιδιαίτερα την ενδιαφέρουσα πρόσφατη πρόταση των Stephen R. Becker και Farhad Pourkamali-Anaraki που ονομάζεται Sparsified k-means. Αν και ο αλγόριθμος αυτός υπάρχει ήδη και επομένως η διπλωματική διατριβή δεν προσφέρει κάποια αλγοριθμική καινοτομία, δεν έχει δοκιμαστεί αρκετά και δεν έχει συνδυαστεί με το Text Analytics Toolbox και άλλες εργαλειοθήκες της MATLAB. Επομένως, πέραν της παρουσίασης της μεθόδου, ασχολούμαστε και με την ενσωμάτωσή της στην εργαλειοθήκη TMG που χρησιμοποιείται για την δημιουργία μητρώων όρων-κειμένων και την ανάκτηση πληροφορίας από κείμενα.
-


Ανάκτηση πληροφορίας
Συσταδοποίηση
k-means
Big data
MATLAB
Εξόρυξη δεδομένων
Γραμμική άλγεβρα
TMG





*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.