Value function approximation in zero–sum Markov games

Value function approximation in zero–sum Markov games

URI: https://www.openarchives.gr/aggregator-openarchives/edm/dias/000058-60604
RDF/XML JSON-LD

Το τεκμήριο παρέχεται από τον φορέα :

Πολυτεχνείο Κρήτης

Αποθετήριο :
Ιδρυματικό Αποθετήριο Πολυτεχνείου Κρήτης

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου^*

κοινοποιήστε το τεκμήριο

Σημασιολογικός εμπλουτισμός από το EKT

ΕΚΤ τύπος τεκμηρίου

Τεκμήριο συνεδρίου (EL)

Επιστημονικό άρθρο (EL)

ΕΚΤ xρονολογία

2002 (EL)

EKT Ιστορική περίοδος

Τίτλος

Value function approximation in zero–sum Markov games (EN)

Δημιουργός

Λαγουδακης Μιχαηλ (EL)

Lagoudakis Michael (EN)

Parr,R. (EN)

Συντελεστής

Πολυτεχνείο Κρήτης (EL)

Technical University of Crete (EN)

Περιγραφή

This paper investigates value function approximation in the context of zero-sum Markov games, which can be viewed as a generalization of the Markov decision process (MDP) framework to the two-agent case. We generalize error bounds from MDPs to Markov games and describe generalizations of reinforcement learning algorithms to Markov games. We present a generalization of the optimal stopping problem to a two-player simultaneous move Markov game. For this special problem, we provide stronger bounds and can guarantee convergence for LSTD and temporal difference learning with linear value function approximation. We demonstrate the viability of value function approximation for Markov games by using the Least squares policy iteration (LSPI) algorithm to learn good policies for a soccer domain and a flow control problem. (EN)

Τύπος

full paper

conferenceItem

Θέμα

Artificial Intelligence (EN)

Πάροχος

Πολυτεχνείο Κρήτης

Αποθετήριο / συλλογή

Ιδρυματικό Αποθετήριο Πολυτεχνείου Κρήτης

Επιμέρους συλλογή

School of Mineral Resources Engineering - Journal Publications

Συνέδριο

18th Conference on Uncertainty in Artificial Intelligence (EL)

Γλώσσα

Αγγλική γλώσσα

Ημερομηνία έκδοσης

2002

Προσδιοριστής

http://purl.tuc.gr/dl/dias/2F95F669-B215-44BD-90AF-6176BD490AA9http://arxiv.org/ftp/arxiv/papers/1301/1301.0580.pdf

*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.

Value function approximation in zero–sum Markov games

Βοηθείστε μας να κάνουμε καλύτερο το OpenArchives.gr.