Ανάπτυξη αλγορίθμου τεχνητής ευφυίας αυτόματης εκμάθησης της στρατηγικής παίκτη στο επιτραπέζιο παιχνίδι Dominion

This item is provided by the institution :
University of West Attica   

Repository :
Institutional Repository Polynoe   

see the original item page
in the repository's web site and access all digital files if the item*



Ανάπτυξη αλγορίθμου τεχνητής ευφυίας αυτόματης εκμάθησης της στρατηγικής παίκτη στο επιτραπέζιο παιχνίδι Dominion

Αγγελόπουλος, Γεώργιος

Ηλεκτρικές και Ηλεκτρονικές Επιστήμες μέσω Έρευνας (MSc by Research in Electrical and Electronics
Σχολή Μηχανικών
Τμήμα Ηλεκτρολόγων και Ηλεκτρονικών Μηχανικών
Μετάφας, Δημήτριος
Famelis, Ioannis
Ζώης, Ηλίας

Μεταπτυχιακή διπλωματική εργασία

2021-02-05

2022-02-10T10:46:54Z


Κατά τα προηγούμενα χρόνια, αρκετά επιτραπέζια παιχνίδια έχουν χρησιμοποιηθεί σαν χώρος ανάπτυξης και δοκιμής, διαφόρων τεχνικών τεχνητής νοημοσύνης. Τα επιτραπέζια παιχνίδια είναι ιδανικά για αυτό το ρόλο, καθώς προσφέρουν ένα περιβάλλον με αυστηρά καθορισμένους κανόνες, που δεν επιδέχονται εξαιρέσεις, και τα αποτελέσματα δεν παρουσιάζουν σφάλματα ή «θορύβους». Είναι ένας ιδεατός κόσμος, στον οποίο μπορούν να δοκιμαστούν θεωρίες και τεχνικές, και να εκτιμηθεί η αποτελεσματικότητα τους, πριν την επέκταση τους στο «χάος» του πραγματικού κόσμου. Στόχος της παρούσης εργασίας ήταν η δημιουργία αλγόριθμου τεχνητής νοημοσύνης, βασισμένου στη μέθοδο της εξαναγκασμένης μάθησης, και πιο συγκεκριμένα στην τεχνική Q Learning, ικανού να αναπτύξει στρατηγική με προοπτικές νίκης, για ένα επιτραπέζιο παιχνίδι. Το ερώτημα που προσπαθούμε να απαντήσουμε, είναι το κατά πόσο η συγκεκριμένη τεχνική, είναι ικανή να ανταποκριθεί με ικανοποιητικό τρόπο, σε ένα πολύπλοκο περιβάλλον, και να εκπαιδεύσει έναν πράκτορα, ώστε να παίρνει την καλύτερη δυνατή απόφαση, όταν ο αριθμός των επιλογών είναι μεγάλος. Στην πορεία της εργασίας ανέκυψε και ένα νέο ερώτημα, κατά πόσο είναι δυνατό επιφέροντας κάποιες αλλαγές στην μέθοδο επιλογής ενεργειών του πράκτορα, να επιταχύνουμε την εκπαίδευση, χωρίς να μειώσουμε την αποτελεσματικότητά του. Επιλέξαμε το επιτραπέζιο παιχνίδι καρτών Dominion (Κυρίαρχος) για τις δοκιμές μας, καθώς έχει αρκετά απλούς κανόνες, αλλά ο αριθμός των διαφορετικών καρτών που χρησιμοποιούνται, δημιουργεί ένα μεγάλο φάσμα διαφορετικών επιλογών, και καθιστά το στόχο της εκπαίδευσης του πράκτορα αρκετά προκλητικό. Επίσης κατά το παρελθόν, άλλες τεχνικές εξαναγκασμένης μάθησης, όπως τα νευρωνικά δίκτυα και τα Monte Carlo Trees, έχουν δοκιμαστεί πάνω στο συγκεκριμένο παιχνίδι, οπότε μπορούν να εξαχθούν χρήσιμα συμπεράσματα, από τα αποτελέσματα της κάθε τεχνικής.


Q-learning
Επιτραπέζια παιχνίδια
Τεχνητή νοημοσύνη
Μέθοδος επιλογής ενεργειών
Εξαναγκασμένη μάθηση
Dominion

Greek

Πανεπιστήμιο Δυτικής Αττικής

ΣΧΟΛΗ ΜΗΧΑΝΙΚΩΝ - Τμήμα Ηλεκτρολόγων και Ηλεκτρονικών Μηχανικών - Μεταπτυχιακές διπλωματικές εργασίες - Ηλεκτρικές και Ηλεκτρονικές Επιστήμες μέσω Έρευνας (MSc by Research in Electrical and Electronics)

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές
https://creativecommons.org/licenses/by-nc-sa/4.0/deed.el




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)