Η παρούσα έρευνα ασχολείται µε την µέθοδο ∆ιασποράς-Συγκέντρωσης. Πρόκειται για µια µέθοδο περιήγησης κειµένων και ανακάλυψης πληροφοριών που ϐασίζεται στην συσταδοποίηση και σε άλλες µεθόδους µηχανικής µάθησης. Στην λειτουργία της µεθόδου εντοπίστηκε ένα πρόβληµα στην ανανέωση των ϐαρών της αναπαράστασης των κειµένων σε κάθε επανάληψη της µεθόδου για το οποίο δεν υπάρχει αναφορά σε προηγούµενες έρευνες. Μετά από πειραµατική ανάλυση για την απόδειξη του προβλήµατος προτείνονται δύο προσεγγίσεις για το Ϲήτηµα της ανανέωσης. Ακόµη, στην παρούσα έρευνα µελετάται το Ϲήτηµα του µεγέθους των διαστάσεων ενός διανυσµατικού χώρου µιας συλλογής κειµένων και γίνονται πειράµατα για την εύρεση του ϐέλτιστου µεγέθους µε σκοπό µια αποδοτικότερη συσταδοποίηση. Τέλος αναπτύσσεται µια εφαρµογή περιήγησης µε την µέθοδο ∆ιασποράς-Συγκέντρωσης ϐασισµένη στα κείµενα της Ελληνικής Βικιπαίδειας. Κατά την διάρκεια της υλοποίηση της εφαρµογής, προστέθηκαν οι προτεινόµενες προσεγγίσεις στα προβλήµατα που ανιχνεύτηκαν και εξετάστηκαν.
The current research is about the Scatter-Gather method. It’s a browsing information and information discovery method that is based on document clustering and other machine learning methods. In its process an issue was found about the recalculation of the document representation in every iteration of the method, for which there was no previous reference in the literature. After an experimental analysis to prove the problem, two new approaches are proposed about the issue. Furthermore, this study looks into the subject of the vector space dimensions of a document collection and experiments are being carried in order to find its optimal size for an efficient cluster analysis. Lastly, a browsing application is developed using the Scatter-Gather method and the texts from the Greek Wikipedia collection. During the implementation of the application, the proposed approaches to the detected issues were also taken into consideration.
Βιβλιογραφία: σ. 138-142
142 σ.
Natural Sciences ▶ Computer and Information Sciences Software
(EN)