δείτε την πρωτότυπη σελίδα τεκμηρίου στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
Comparison of reinforcement learning methods for problems with discrete state and action space
Η ιστορία της ενισχυτικής μάθησης ξεκινά το 1950 με την εισαγωγή του δυναμικού προγραμματισμού από τον Richard Bellman. Ωστόσο, πρόσφατα άρχισε αυτό το πεδίο της μηχανικής μάθησης να ανθίζει. Η πρόοδος στην τεχνολογία και συγκεκριμένα στις κάρτες γραφικών επέτρεψε την ενσωμάτωση “βαθιών” νευρωνικών δικτύων σε αλγόριθμους ενισχυτικής μάθησης γεννώντας τη “βαθιά” ενισχυτική μάθηση. Η υψηλή επεξεργαστική ισχύς των καρτών γραφικών σε συνδυασμό με την παράλληλη εκτέλεση των αλγεβρικών υπολογισμών μείωσαν σημαντικά τον απαιτούμενο χρόνο της μαθησιακής διαδικασίας. Αυτό το τεράστιο τεχνολογικό βήμα επέτρεψε στους επιστήμονες να πειραματιστούν με διαφορετικές ιδέες, με αποτέλεσμα να δημιουργηθούν αλγόριθμοι τελευταίας τεχνολογίας που χρησιμοποιούνται πλεον στην καθημερινή ζωή. Σε αυτή τη διατριβή ρίχνουμε μια ματιά σε μερικούς από τους πιο γνωστούς αλγόριθμους και τους δοκιμάζουμε σε δύο διαφορετικά περιβάλλοντα, με διακριτό χώρο κατάστασης και κινήσεων. Ο απώτερος στόχος είναι να παρουσιαστεί η πρόοδος που σημειώθηκε σε αυτό το πεδίο συγκρίνοντας τον χρόνο που απαιτείται για κάθε αλγόριθμο να προσαρμοστεί σε αυτά τα περιβάλλοντα. Στο πρώτο κεφάλαιο επεξηγούνται οι βασικές έννοιες της ενισχυτικής μάθησης. Στο δεύτερο κεφάλαιο αναλύονται οι αλγόριθμοι που επιλέχθηκαν και στο τρίτο και τελευταίο κεφάλαιο γίνεται σύγκριση της απόδοσης κάθε αλγορίθμου σε κάθε περιβάλλον.
(EL)
The history of reinforcement learning begins back in 1950 with the introduction of dynamic programming by Richard Bellman. However, it wasn’t up until recently that this field of machine learning begun to flourish. The advancement in technology and specifically in graphics cards allowed the incorporation of deep neural networks in reinforcement learning algorithms giving birth to deep reinforcement learning. The high processing power of the graphics cards in combination with the parallel execution of the algebraic computations reduced significantly the required time of the learning process. That massive technological step allowed scientists to experiment with different kinds of ideas producing state of the art algorithms that are now used in everyday life. In this thesis we take a look at some of the most renowned deep reinforcement learning algorithms and put them to the test against two different environments with discrete state and action space. The ultimate goal is to present the advancement that occurred in that field by comparing the time required for each algorithm to adapt to these environments. In the first chapter the basic concepts of reinforcement learning are explained. In the second chapter the algorithms that were chosen are analyzed and in the third and final chapter the performance of each algorithm on each environment is compared.
(EN)
*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.
Comparison of reinforcement learning methods for problems with discrete state and action space
Comparison of reinforcement learning methods for problems with discrete state and action space
Βοηθείστε μας να κάνουμε καλύτερο το OpenArchives.gr.