Διαχείριση Δεδομένων στις πλατφόρμες ΚΝΙΜE & WEKA

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Διαχείριση Δεδομένων στις πλατφόρμες ΚΝΙΜE & WEKA

Κωτσάκη, Παναγιώτα

Triantafyllou, Ioannis
Σχολή Διοικητικών, Οικονομικών & Κοινωνικών Επιστημών
Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης
Δενδρινός, Μάρκος
Kouis, Dimitris
Διαχείριση Πληροφοριών σε Βιβλιοθήκες, Αρχεία, Μουσεία

Μεταπτυχιακή διπλωματική εργασία

2020-06-11

2021-01-28T10:50:36Z


Στην παρούσα εργασία συγκρίνουμε τα εργαλεία εξόρυξης δεδομένων KNIME και Knowledge Flow του WEKA σε θεωρητικό αλλά και πειραματικό πλαίσιο με σκοπό την εύρεση ενός μοντέλου πρόβλεψης της διάρκειας ψηφιοποίησης του αρχειακού υλικού (φακέλων) της εταιρείας «Αρχειοθήκη Α.Ε.». Η τεχνική που ακολουθήθηκε για την δημιουργία του μοντέλου πρόβλεψης είναι η τεχνική της παλινδρόμησης με βάση τους αλγορίθμους KNN, SVM, Random Forest, Decision Tree και Linear Regression σε ένα σύνολο δεδομένων προερχόμενο από την ίδια την εταιρεία. Σύμφωνα με τα πειραματικά μας αποτελέσματα, το WEKA και το ΚΝΙΜΕ παρέχουν εξίσου καλά αποτελέσματα πρόβλεψης με το WEKA να διαθέτει περισσότερους αλγορίθμους για την συγκεκριμένη τεχνική εξόρυξης. Το KNIME παρέχει μία πιο εύχρηστη, διαισθητική/ενστικτώδη διεπαφή χρήστη (intuitive user interface), δηλαδή ο χρήστης να είναι σε θέση να χρησιμοποιήσει τη ροή εργασίας εύκολα και γρήγορα χωρίς να χρειάζεται να προβληματιστεί πολύ πώς να το κάνει, ώστε η κατανόηση της ροής να είναι κατάλληλη και για πιο αρχάριους χρήστες. Τα αποτελέσματα μπορεί να διαφέρουν ανάλογα με την εφαρμογή διαφορετικών αλγορίθμων, από τα ευρήματα μας όμως προέκυψε ότι οι αλγόριθμοι Random Forest και Decision Tree έδωσαν τα καλύτερα αποτελέσματα με βάση όλα τα χαρακτηριστικά, όπως ο χρήστης, ο αριθμός των εβδομάδων, ο αριθμός των εγγράφων και ο αριθμός των σελίδων κάθε φακέλου.


Decision Tree
Παλινδρόμηση
Linear Regression
Knime
Knn
Svm
Weka
Εξόρυξη δεδομένων
Random Forest

Ελληνική γλώσσα

Πανεπιστήμιο Δυτικής Αττικής

ΣΧΟΛΗ ΔΙΟΙΚΗΤΙΚΩΝ, ΟΙΚΟΝΟΜΙΚΩΝ & ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ - Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης - Μεταπτυχιακές διπλωματικές εργασίες - Διαχείριση Πληροφοριών σε Βιβλιοθήκες, Αρχεία, Μουσεία

http://creativecommons.org/licenses/by-nc-nd/4.0/
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.