Construction of decision trees using genetic algorithms - algorithmic extensions.

 
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2018 (EL)
ΚΑΤΑΣΚΕΥΗ ΔΕΝΤΡΩΝ ΑΠΟΦΑΣΗΣ ΜΕ ΧΡΗΣΗ ΓΕΝΕΤΙΚΩΝ ΑΛΓΟΡΙΘΜΩΝ - ΑΛΓΟΡΙΘΜΙΚΕΣ ΠΡΟΕΚΤΑΣΕΙΣ
Construction of decision trees using genetic algorithms - algorithmic extensions.

ΚΑΚΚΟΣ, ΒΑΣΙΛΗΣ

ΚΑΛΛΕΣ, ΔΗΜΗΤΡΙΟΣ
ΣΓΑΡΜΠΑΣ, ΚΥΡΙΑΚΟΣ
ΠΛΑΓΙΑΝΑΚΟΣ, ΒΑΣΙΛΕΙΟΣ

Η παρούσα πτυχιακή εργασία, αφορά στην ανάπτυξη ενός συστήματος για τη βελτιστοποίηση του τρόπου κατασκευής δέντρων απόφασης, με χρήση γενετικών αλγορίθμων. Στο πρώτο μέρος της εργασίας, θα αναφέρουμε τον αλγόριθμο GATree ο οποίος κατασκευάζει δέντρα απόφασης με γενετικούς αλγορίθμους. Τα δέντρα απόφασης είναι ένας διαδεδομένος και εύχρηστος τρόπος οργάνωσης και απεικόνισης βάσεων γνώσης για έμπειρα συστήματα. Τόσο κατά τη μελέτη όσο και κατά τη χρήση τους, προκύπτουν πολλά ενδιαφέροντα θεωρητικά και πειραματικά προβλήματα. Στο δεύτερο μέρος της εν λόγω εργασίας, θα μεταγράψουμε τον αλγόριθμο GATree και για τη μεταγραφή επιλέχθηκε η γλώσσα προγραμματισμού R. Η γλώσσα R υποστηρίζεται από ένα περιβάλλον ελεύθερου λογισμικού. Επίσης έχει τη δυνατότητα να αλληλεπιδρά και με άλλες γλώσσες προγραμματισμού (C, C++, Java, Python) και είναι ευρέως διαδεδομένη για στατιστική ανάλυση και εξόρυξη δεδομένων. Αυτά τα χαρακτηριστικά μας οδήγησαν στην επιλογή της συγκεκριμένης γλώσσας, καθώς σκοπός της συγκεκριμένης εργασίας είναι η δημιουργία ενός συστήματος, το οποίο μελλοντικά θα μπορεί να επαναχρησιμοποιηθεί και θα είναι εύκολη η επεξεργασία του για ερευνητικό σκοπό, με στόχο την βελτίωση της απόδοσης του συστήματος ως προς τον χρόνο και τον χώρο, καθώς και ως προς την αποτελεσματικότητά του. Μετά την ολοκλήρωση της υλοποίησης του συστήματος θα πραγματοποιηθούν πειράματα από τα οποία θα εξετάζεται, σε πρώτη φάση, αν το GATree ανταποκρίνεται στις προδιαγραφές του συστήματος GATree που προϋπήρχε και έπειτα, με χρήση συνόλων δεδομένων με παρόμοια χαρακτηριστικά, θα γίνεται εξαγωγή ποιοτικών χαρακτηριστικών και συμπερασμάτων. Τα συμπεράσματα θα εξάγονται έπειτα από σύγκριση των αποτελεσμάτων μεταξύ τους.
Περιέχει : πίνακες, διαγράμματα, εικόνες
The present dissertation is about the development of a system for optimizing the building of decision trees using genetic algorithms. In the first part of the project, we review the GATree algorithm which develops decision trees using of genetic algorithms. Decision trees are a common and simple method for organizing and visualizing knowledge bases for expert systems. Many interesting theoretical and experimental problems have risen out of decision tree research. In the second part, we will rewrite the GATree algorithm and using the R programming software. R is supported by a free IDE (integrated development) environment. Also, R can be integrated with a variety of other languages (C, C++, Java, Python) and is widely used for statistical analysis and data mining. These features were the reasons why we chose R since the objective of the dissertation is the development of a system which should be easily extended by other users to improve time and space efficiency. Upon completion of the implementation of the system, experiments will be carried out to examine, first, whether GATree meets the pre – existing GATree system specifications, and then qualitative features and conclusions will be extracted using data sets with similar characteristics. The conclusions will be drawn after comparing the results with each other.

Πτυχιακή Εργασία / Graduate Dissertation

programming language R
δέντρα απόφασης
κατηγοριοποίηση
decision trees
γενετικοί αλγόριθμοι
μηχανική μάθηση
γλώσσα προγραμματισμού R
genetic algorithms
GATree
classification
machine learning


Ελληνική γλώσσα

2018-07-21
2018-09-06T07:41:57Z


Ελληνικό Ανοικτό Πανεπιστήμιο / Hellenic Open University

112
3
5

Αναφορά Δημιουργού 4.0 Διεθνές



*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.