Rollout sampling approximate policy iteration

Rollout sampling approximate policy iteration

URI: https://www.openarchives.gr/aggregator-openarchives/edm/dias/000058-52038
RDF/XML JSON-LD

Το τεκμήριο παρέχεται από τον φορέα :

Πολυτεχνείο Κρήτης

Αποθετήριο :
Ιδρυματικό Αποθετήριο Πολυτεχνείου Κρήτης

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου^*

κοινοποιήστε το τεκμήριο

Σημασιολογικός εμπλουτισμός από το EKT

ΕΚΤ τύπος τεκμηρίου

Τμήμα περιοδικού (EL)

Επιστημονικό άρθρο (EL)

ΕΚΤ xρονολογία

2008 (EL)

EKT Ιστορική περίοδος

Τίτλος

Rollout sampling approximate policy iteration (EN)

Δημιουργός

Λαγουδακης Μιχαηλ (EL)

Lagoudakis Michael (EN)

Dimitrakakis Christos (EN)

Συντελεστής

Πολυτεχνείο Κρήτης (EL)

Technical University of Crete (EN)

Περιγραφή

Several researchers have recently investigated the connection between reinforcement learning and classification. We are motivated by proposals of approximate policy iteration schemes without value functions, which focus on policy representation using classifiers and address policy learning as a supervised learning problem. This paper proposes variants of an improved policy iteration scheme which addresses the core sampling problem in evaluating a policy through simulation as a multi-armed bandit machine. The resulting algorithm offers comparable performance to the previous algorithm achieved, however, with significantly less computational effort. An order of magnitude improvement is demonstrated experimentally in two standard reinforcement learning domains: inverted pendulum and mountain-car. (EN)

Τύπος

journalArticle

Θέμα

Approximate policy iteration (EN)

Reinforcement learning (EN)

Rollouts (EN)

Classification (EN)

Sample complexity (EN)

Bandit problems (EN)

Πάροχος

Πολυτεχνείο Κρήτης

Αποθετήριο / συλλογή

Ιδρυματικό Αποθετήριο Πολυτεχνείου Κρήτης

Επιμέρους συλλογή

School of Production Engineering and Management - Journal Publications

Περιοδικό

Machine Learning (EN)

Γλώσσα

Αγγλική γλώσσα

Ημερομηνία έκδοσης

2008

Προσδιοριστής

http://purl.tuc.gr/dl/dias/157117EC-5401-47A1-B453-9D39AAFFC2E210.1007/s10994-008-5069-3

Εκδότης

Springer Verlag (EN)

*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.

Rollout sampling approximate policy iteration

Βοηθείστε μας να κάνουμε καλύτερο το OpenArchives.gr.