Ενισχυτική μάθηση σε παιχνίδια δύο ατόμων: εφαρμογή στο τάβλι

Ενισχυτική μάθηση σε παιχνίδια δύο ατόμων: εφαρμογή στο τάβλι

URI: https://www.openarchives.gr/aggregator-openarchives/edm/psepheda/000004-2159_14323
RDF/XML JSON-LD

Το τεκμήριο παρέχεται από τον φορέα :
Πανεπιστήμιο Μακεδονίας

Αποθετήριο :
Ψηφίδα - Ψηφιακή Βιβλιοθήκη και Ιδρυματικό Καταθετήριο του Πανεπιστημίου Μακεδονίας

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου^*

Τίτλος

Ενισχυτική μάθηση σε παιχνίδια δύο ατόμων: εφαρμογή στο τάβλι (EL)

Δημιουργός

Παπαχρήστου, Νικόλαος (EL)

Συντελεστής

Ρεφανίδης, Ιωάννης (EL)

Τύπος

Electronic Thesis or Dissertation (EN)

Text (EN)

Διπλωματική εργασία
Μεταπτυχιακή εργασία (EL)

Ημερομηνία έκδοσης

2011-04-06T07:19:11Z

2010 (EN)

Χρονολογία

2010 (EL)

Περιγραφή

Τα παιχνίδια δύο ατόμων όπως το σκάκι, το τάβλι, το go, κ.ά. έχουν αναγνωριστεί ως ιδανικά πεδία έρευνας και δοκιμών για τις σύγχρονες μεθόδους τεχνητής νοημοσύνης και μηχανικής μάθηθης. Μία από τις πιο ενδιαφέρουσες διαδικασίες μάθησης που μπορεί να εφαρμοστεί σε αυτά είναι η ενισχυτική μάθηση μέσω της αυτοεκπαίδευσης. Με αυτήν την τεχνική ένας πράκτορας παίζει πολλές παρτίδες με τον εαυτό του και χρησιμοποιεί ένα σήμα «ανταμοιβής» στο τέλος κάθε παρτίδας, για να βελτιώσει σταδιακά την ποιότητα της επιλογής των κινήσεων. Σημαντικότερος εκπρόσωπος αυτής της μεθόδου είναι το πρόγραμμα TD-Gammon του Tesauro. Στην εργασία αυτή επιχειρείται η κατασκευή ενός πράκτορα που να παίζει τα παιχνίδια του ταβλιού «πλακωτό» και «φεύγα». Κατά το πρότυπο του TD-Gammon, ο πράκτοράς μας μαθαίνει από την έκβαση των παρτίδων αυτοεκπαίδευσης χρησιμοποιώντας ένα τεχνητό νευρωνικό δίκτυο για την εκμάκθηση της συνάρτησης αξιολόγησης των παιχνιδιών αυτών. Τέλος, συγκρίνουμε τις διάφορες εκδόσεις των εκπαιδευμένων πρακτόρων μεταξύ τους καθώς και με το πρόγραμμα ανοικτού κώδικα Tavli3D. (EL)

Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2010. (EL)

Submitted by Nikolaos Papachristou ([email protected]) on 2011-04-05T10:43:39Z No. of bitstreams: 1 MasterThesis_final2.pdf: 3116128 bytes, checksum: 925b09712366d4a6ac0c54c310752de4 (MD5) (EN)

Made available in DSpace on 2011-04-06T07:19:11Z (GMT). No. of bitstreams: 1 MasterThesis_final2.pdf: 3116128 bytes, checksum: 925b09712366d4a6ac0c54c310752de4 (MD5) Previous issue date: 2010 (EN)

Approved for entry into archive by Παναγιώτα Πατραγκού([email protected]) on 2011-04-06T07:19:11Z (GMT) No. of bitstreams: 1 MasterThesis_final2.pdf: 3116128 bytes, checksum: 925b09712366d4a6ac0c54c310752de4 (MD5) (EN)

Επιστημονικό πεδίο

Φυσικές Επιστήμες
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική (EL)

Θέμα

Φεύγα (EL)

Πλακωτό (EL)

Νευρωνικά Δίκτυα (EL)

Ενισχυτική μάθηση (EN)

Temporal difference learning (EN)

Reinforcement learning (EN)

Neural Networks (EN)

Backgammon (EN)

TD(λ) (EN)

Τάβλι (EN)

Εκδότης

Πανεπιστήμιο Μακεδονίας Οικονομικών και Κοινωνικών Επιστημών. (EL)

Σχολή/Τμήμα/Ινστιτούτο

Πρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης στην Εφαρμοσμένη Πληροφορική (EL)

Πανεπιστήμιο Μακεδονίας

Πάροχος

Πανεπιστήμιο Μακεδονίας

Αποθετήριο / συλλογή

Ψηφίδα - Ψηφιακή Βιβλιοθήκη και Ιδρυματικό Καταθετήριο του Πανεπιστημίου Μακεδονίας

Επιμέρους συλλογή

Ερευνητικές εργασίες φοιτητών / Students’ research papers

Διπλωματικές Εργασίες / Master’s Theses

Ιδρυματικό Καταθετήριο/Institutional Repository

ΠΜΣ Εφαρμοσμένης Πληροφορικής (M)

*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.

Ενισχυτική μάθηση σε παιχνίδια δύο ατόμων: εφαρμογή στο τάβλι

Βοηθείστε μας να κάνουμε καλύτερο το OpenArchives.gr.