Τα κυβερνο-φυσικά συστήματα είναι συζευγμένα συστήματα, αποτελούμενα από ψηφιακές και φυσικές οντότητες που αλληλεπιδρούν μεταξύ τους. Οι προσομοιώσεις και οι δοκιμές της επιθυμητής συμπεριφοράς τέτοιων υβριδικών συστημάτων, τα οποία παρουσιάζουν διακριτή αλλά και συνεχή δυναμική συμπεριφορά, είναι δύσκολες και συχνά επικίνδυνες. Μερικά παραδείγματα τέτοιων συστημάτων είναι τα αυτόνομα αυτοκίνητα, οι ρομποτικές εφαρμογές και οι ιατρικές συσκευές παρακολούθησης. Η ικανότητα μοντελοποίησης τέτοιων συστημάτων απαιτεί ανάλυση φυσικών φαινομένων και εφαρμογή εκτεταμένων δοκιμών για απρόσμενα συμβάντα.
Σε αυτή τη πτυχιακή, δείχνουμε πώς μέσω της χρήσης μεθόδων μηχανικής μάθησης μπορούμε να συμβάλουμε στην ενίσχυση των κυβερνο-φυσικών συστημάτων με την επίτευξη ευφυούς συμπεριφοράς. Οι αυτόνομοι πράκτορες μέσω της αξιοποίησης μιας προσέγγισης που ονομάζεται state-action-reward-state, είναι σε θέση να μάθουν πώς να βελτιστοποιήσουν τη συμπεριφορά τους και να δράσουν έξυπνα σε ένα άγνωστο περιβάλλον. Τέλος, παρέχουμε επίσης μια εφαρμογή μάθησης με ενίσχυση που δείχνει την προσέγγισή μας.
(EL)