Ενισχυτική μάθηση για ημι-Mαρκοβιανές διαδικασίες απόφασης με εφαρμογές

Ενισχυτική μάθηση για ημι-Mαρκοβιανές διαδικασίες απόφασης με εφαρμογές

URI: https://www.openarchives.gr/aggregator-openarchives/edm/pyxida/000170-123456789_898
RDF/XML JSON-LD

Το τεκμήριο παρέχεται από τον φορέα :
Οικονομικό Πανεπιστήμιο Αθηνών

Αποθετήριο :
ΠΥΞΙΔΑ

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου^*

Τίτλος

Ενισχυτική μάθηση για ημι-Mαρκοβιανές διαδικασίες απόφασης με εφαρμογές (EL)

Reinforcement learning for semi-Markov decision processes with applications (EN)

Δημιουργός

Παλαιού, Κυριακή (EL)

Palaiou, Kyriaki (EN)

Συντελεστής

Manou, Athanasia (EN)

Burnetas, Apostolos (EN)

Trevezas, Samis (EN)

Τύπος

Text

Διπλωματική εργασία
Μεταπτυχιακή εργασία (EL)

Ημερομηνία έκδοσης

2023-09-05 13:26:21

2025-03-26T19:05:30Z

05-09-2023

Χρονολογία

2023 (EL)

Περιγραφή

Αυτή η διατριβή επικεντρώνεται στις ημι-Μαρκοβιανές Διαδικασίες Απόφασης και τη σχέση τους με την Ενισχυτική Μάθηση μέσω της τεχνικής Q-learning. Ξεκινάμε με τη συζήτηση ορισμένων γενικών ιδεών γύρω από τη Μηχανική Μάθηση, την Ενισχυτική Μάθηση και την Ιεραρχική Ενισχυτική Μάθηση. Συνεχίζουμε με μια ανάλυση της θεωρίας των Μαρκοβιανών Διαδικασιών από τη μαθηματική άποψη. Έπειτα, γενικεύουμε την προηγούμενη θεωρία σε συνεχές χρόνο, δηλαδή σε ημι-Μαρκοβιανές Διαδικασίες Απόφασης. Τέλος, παρουσιάζεται ένας αλγόριθμος Ενισχυτικής Μάθησης βασισμένος σε προσομοίωση για την επίλυση ημι-Μαρκοβιανών Διαδικασιών Απόφασης. Ειδικότερα, ο αλγόριθμος που αναπτύχθηκε εδώ ελέγχεται σε ένα πρόβλημα προληπτικής συντήρησης που αντιμετωπίζεται σε συστήματα παραγωγής-αποθήκευσης. (EL)

This thesis focuses on semi-Markov decision processes and their connection with Reinforcement Learning via Q-learning technique. We start by discussing some general ideas around Machine Learning, Reinforcement Learning and Hierarchical Reinforcement Learning. We continue with an analysis of the theory of Markov Decision Processes from the mathematical point of view. After that, we generalize the previous theory into continuous time i.e. into the semi-Markov Decision Processes. Finally, it is presented a new simulation-based Reinforcement Learning algorithm for solving SMDPs. In particular, the algorithm developed here is tested on a preventive maintenance problem encountered in production-inventory (PI) systems. (EN)

Επιστημονικό πεδίο

Φυσικές Επιστήμες
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική (EL)

Θέμα

Συστήματα παραγωγής-αποθήκευσης (EL)

Ενισχυτική μάθηση (EL)

Hμι-Μαρκοβιανές διαδικασίες απόφασης (EL)

Semi-Markov decision processes (SMDPs) (EN)

Reinforcement learning (EN)

Production-Inventory (PI) systems (EN)

Σχολή/Τμήμα/Ινστιτούτο

Athens University of Economics and Business, Department of Informatics (EN)

Οικονομικό Πανεπιστήμιο Αθηνών ▶ Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας
Τμήμα Πληροφορικής

Δικαιώματα

https://creativecommons.org/licenses/by/4.0/

CC BY: Attribution alone 4.0

Πάροχος

Οικονομικό Πανεπιστήμιο Αθηνών

Αποθετήριο / συλλογή

ΠΥΞΙΔΑ

Επιμέρους συλλογή

Ακαδημαϊκό Αποθετήριο

Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας Τμήμα Πληροφορικής

Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας

Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας - Τμήμα Πληροφορικής - Μεταπτυχιακές Εργασίες

*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.

Ενισχυτική μάθηση για ημι-Mαρκοβιανές διαδικασίες απόφασης με εφαρμογές

Βοηθείστε μας να κάνουμε καλύτερο το OpenArchives.gr.