Περιήγηση πληροφοριών µε χρήση ∆ιασποράς-Συγκέντρωσης

Το τεκμήριο παρέχεται από τον φορέα :
Δημοκρίτειο Πανεπιστήμιο Θράκης   

Αποθετήριο :
Αποθετήριο Δημοκρίτειου Πανεπιστημίου   

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Περιήγηση πληροφοριών µε χρήση ∆ιασποράς-Συγκέντρωσης

Δήμητσας, Μάρκος
Dimitsas, Markos

Τσαουσίδης, Βασίλειος
Εφραιμίδης, Παύλος
Tsaoussidis, Vassilis
Αραμπατζής, Αυγερινός
Efraimidis, Pavlos
Arampatzis, Avi

masterThesis

2023-10-16T07:22:14Z
2018-10-24


Η παρούσα έρευνα ασχολείται µε την µέθοδο ∆ιασποράς-Συγκέντρωσης. Πρόκειται για µια µέθοδο περιήγησης κειµένων και ανακάλυψης πληροφοριών που ϐασίζεται στην συσταδοποίηση και σε άλλες µεθόδους µηχανικής µάθησης. Στην λειτουργία της µεθόδου εντοπίστηκε ένα πρόβληµα στην ανανέωση των ϐαρών της αναπαράστασης των κειµένων σε κάθε επανάληψη της µεθόδου για το οποίο δεν υπάρχει αναφορά σε προηγούµενες έρευνες. Μετά από πειραµατική ανάλυση για την απόδειξη του προβλήµατος προτείνονται δύο προσεγγίσεις για το Ϲήτηµα της ανανέωσης. Ακόµη, στην παρούσα έρευνα µελετάται το Ϲήτηµα του µεγέθους των διαστάσεων ενός διανυσµατικού χώρου µιας συλλογής κειµένων και γίνονται πειράµατα για την εύρεση του ϐέλτιστου µεγέθους µε σκοπό µια αποδοτικότερη συσταδοποίηση. Τέλος αναπτύσσεται µια εφαρµογή περιήγησης µε την µέθοδο ∆ιασποράς-Συγκέντρωσης ϐασισµένη στα κείµενα της Ελληνικής Βικιπαίδειας. Κατά την διάρκεια της υλοποίηση της εφαρµογής, προστέθηκαν οι προτεινόµενες προσεγγίσεις στα προβλήµατα που ανιχνεύτηκαν και εξετάστηκαν.
The current research is about the Scatter-Gather method. It’s a browsing information and information discovery method that is based on document clustering and other machine learning methods. In its process an issue was found about the recalculation of the document representation in every iteration of the method, for which there was no previous reference in the literature. After an experimental analysis to prove the problem, two new approaches are proposed about the issue. Furthermore, this study looks into the subject of the vector space dimensions of a document collection and experiments are being carried in order to find its optimal size for an efficient cluster analysis. Lastly, a browsing application is developed using the Scatter-Gather method and the texts from the Greek Wikipedia collection. During the implementation of the application, the proposed approaches to the detected issues were also taken into consideration.
Βιβλιογραφία: σ. 138-142
142 σ.


Τιτλοφόρηση συστάδων
Document clustering
Συσταδοποίηση κειµένων
Scatter-Gather
Browsing information
Περιήγηση δεδοµένων
Information retrieval
∆ιασπορά-Συγκέντρωση
Cluster labeling

Ελληνική γλώσσα

Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Λογισμικού και Ανάπτυξης Εφαρμογών
duth


http://creativecommons.org/licenses/by-nc-nd/3.0/us/
Attribution-NonCommercial-NoDerivs 3.0 United States
free




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.