Περιήγηση πληροφοριών µε χρήση ∆ιασποράς-Συγκέντρωσης

This item is provided by the institution :
Democritus University of Thrace   

Repository :
Repository of DUTH   

see the original item page
in the repository's web site and access all digital files if the item*



Περιήγηση πληροφοριών µε χρήση ∆ιασποράς-Συγκέντρωσης

Δήμητσας, Μάρκος
Dimitsas, Markos

Τσαουσίδης, Βασίλειος
Εφραιμίδης, Παύλος
Tsaoussidis, Vassilis
Αραμπατζής, Αυγερινός
Efraimidis, Pavlos
Arampatzis, Avi

masterThesis

2023-10-16T07:22:14Z
2018-10-24


Η παρούσα έρευνα ασχολείται µε την µέθοδο ∆ιασποράς-Συγκέντρωσης. Πρόκειται για µια µέθοδο περιήγησης κειµένων και ανακάλυψης πληροφοριών που ϐασίζεται στην συσταδοποίηση και σε άλλες µεθόδους µηχανικής µάθησης. Στην λειτουργία της µεθόδου εντοπίστηκε ένα πρόβληµα στην ανανέωση των ϐαρών της αναπαράστασης των κειµένων σε κάθε επανάληψη της µεθόδου για το οποίο δεν υπάρχει αναφορά σε προηγούµενες έρευνες. Μετά από πειραµατική ανάλυση για την απόδειξη του προβλήµατος προτείνονται δύο προσεγγίσεις για το Ϲήτηµα της ανανέωσης. Ακόµη, στην παρούσα έρευνα µελετάται το Ϲήτηµα του µεγέθους των διαστάσεων ενός διανυσµατικού χώρου µιας συλλογής κειµένων και γίνονται πειράµατα για την εύρεση του ϐέλτιστου µεγέθους µε σκοπό µια αποδοτικότερη συσταδοποίηση. Τέλος αναπτύσσεται µια εφαρµογή περιήγησης µε την µέθοδο ∆ιασποράς-Συγκέντρωσης ϐασισµένη στα κείµενα της Ελληνικής Βικιπαίδειας. Κατά την διάρκεια της υλοποίηση της εφαρµογής, προστέθηκαν οι προτεινόµενες προσεγγίσεις στα προβλήµατα που ανιχνεύτηκαν και εξετάστηκαν.
The current research is about the Scatter-Gather method. It’s a browsing information and information discovery method that is based on document clustering and other machine learning methods. In its process an issue was found about the recalculation of the document representation in every iteration of the method, for which there was no previous reference in the literature. After an experimental analysis to prove the problem, two new approaches are proposed about the issue. Furthermore, this study looks into the subject of the vector space dimensions of a document collection and experiments are being carried in order to find its optimal size for an efficient cluster analysis. Lastly, a browsing application is developed using the Scatter-Gather method and the texts from the Greek Wikipedia collection. During the implementation of the application, the proposed approaches to the detected issues were also taken into consideration.
Βιβλιογραφία: σ. 138-142
142 σ.


Τιτλοφόρηση συστάδων
Document clustering
Συσταδοποίηση κειµένων
Scatter-Gather
Browsing information
Περιήγηση δεδοµένων
Information retrieval
∆ιασπορά-Συγκέντρωση
Cluster labeling

Greek

Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Λογισμικού και Ανάπτυξης Εφαρμογών
duth


http://creativecommons.org/licenses/by-nc-nd/3.0/us/
Attribution-NonCommercial-NoDerivs 3.0 United States
free




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)