Εξόρυξη γνώσης από βιβλιογραφικά δεδομένα

 
This item is provided by the institution :

Repository :
Library and Information Center ESTIA
see the original item page
in the repository's web site and access all digital files if the item*
share




2014 (EN)

Εξόρυξη γνώσης από βιβλιογραφικά δεδομένα

Παναγόπουλος, Γεώργιος

Τα βιβλιογραφικά δεδομένα είναι ζωτικής σημασίας για την ακαδημαϊκή κοινωνία που αποτελείται από ζωτική ύλη για μελετητές και ερευνητές. Με τα χρόνια, διάφορες προσπάθειες έχουν γίνει, προκειμένου να εκμεταλλευτούν αυτή την πηγή των πληροφοριών με τον καλύτερο δυνατό τρόπο, αποκαλύπτοντας πολλές επιστημονικές καινοτομίες κατά τη διάρκεια αυτής της διαδικασίας, οι οποίες αργότερα εφαρμόστηκαν για άλλους σκοπούς. Από την άλλη πλευρά, έχει υπηρετήσει ως ένα ευημερών πεδίο πειραματισμών σχετικά με διάφορες μεθοδολογίες στον τομέα της πληροφορικής, κυρίως λόγω της πολυμορφίας του. Ως αποτέλεσμα τα βιβλιογραφικά δεδομένα είναι μια ιδανική πάγκο δοκιμών για τον συνδυασμό διαφόρων δεδομένων εξόρυξη μεθοδολογίες και εξόρυξη γνώσης. Ο στόχος αυτής της εργασίας είναι να εισαγάγει μια νέα προσέγγιση στο πρόβλημα του χαρακτηρισμού της επιτυχίας των συγγραφέων, όχι μόνο με βάση τις δημοσίευσες τους , αλλά και με τις επιπτώσεις της συνεργασίας τους με άλλους συγγραφείς και την εξέλιξη των παραπάνω στο χρόνο. Ως απόδειξη της έννοιας της εργασίας μας, έχουμε επεξεργαστεί τις δημοσιεύσεις όλων των συγγραφέων που συνδέονται με ελληνικά πανεπιστήμια όπως δόθηκε από την ψηφιακή βιβλιοθήκη Scopus.Πιο συγκεκριμένα, για κάθε συγγραφέα, συλλέγουμε πληροφορίες σχετικά με τον αριθμό των δημοσιεύσεων και τις παραπομπές σε ετήσια βάση. Εκτός από αυτό, έχουμε κατασκευάσει δύο τύπους γράφων συνεργασίας, όπου κάθε συγγραφέας είναι συνδεδεμένο με τον/την συν-συγγραφείς με ακμές που υποδεικνύουν είτε τη δύναμη ή την επίδραση της συνεργασίας. Οι γράφοι έχουν κατασκευαστεί σε ετήσια βάση, καθώς και τα βάρη των ακμών να είναι αθροιστικά με σκοπό τη συγκέντρωση των πληροφοριών από τα προηγούμενα χρόνια. Τέλος, εφαρμόζουμε πολλές τεχνικές εξόρυξης γράφων από την βιολογία και την ανάλυση κοινωνικών δικτύων ώστε να ορίσουμε την κοινωνικότητα των συγγραφέων στους προαναφερθείς γράφους. Έπειτα χρησιμοποιούμε αυτά τα χαρακτηριστικά για να δημιουργήσουμε δείκτες αλλαγών για να συλλάβουμε την εξέλιξη των χαρακτηριστικών συγγραφέων στο χρόνο. Σε επόμενη φάση, ομαδοποιούμε τους συγγραφείς με παρόμοιο αριθμό δημοσιεύσεων, αναφορών και προφίλ συνεργασιών χρησιμοποιώντας τον k-means αλγόριθμο ομαδοποίησης και μια λίστα από γνωστές μετρικές για αξιολόγηση ομαδοποίησης ώστε να καθορίσουμε τον καλύτερο αριθμό των ομάδων. Έπειτα δημιουργούνται επιγραφές για κάθε ομάδα με βάση τα πιο εξέχων χαρακτηριστικά τους.Για να ανακαλύψουμε τα πιο σημαντικά σε πληροφορία χαρακτηριστικά χρησιμοποιούμε στατιστικές μεθόδους. Τέλος κάνουμε μια ομαδοποίηση με βάση χρονολογικές σειρές χρησιμοποιώντας dynamic time warping για να ομαδοποιήσουμε τους συγγραφείς με βάση το χρονολόγιο και συγκρίνουμε τα αποτελέσματα με αυτά της κανονικής ομαδοποίησης.

graduate_thesis
Πτυχιακή Εργασία (EL)
Graduate Thesis (EN)

εξόρυξη δεδομένων
χρονικά μεταβαλλόμενοι γράφοι
συσταδοποίηση
βιβλιογραφικά δεδομένα


2014-06


Αναφορά Δημιουργού – Μη Εμπορική Χρήση – Όχι Παράγωγα Έργα 4.0



*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)