Η αναγνώριση ανθρώπινης δραστηριότητας έχει απασχολήσει αισθητά το ερευνητικό εν-
διαφέρον την τελευταία δεκαετία. Συγκεκριμένα, η ταξινόμηση χρονοσειρών με δεδομένα
από αισθητήρες κίνησης αποτελεί τον πυρήνα για αρκετές έρευνες οι οποίες κυρίως χρη-
σιμοποιούν βαθιά νευρωνικά δίκτυα συνέλιξης και ανατροφοδότησης. Η χρήση τέτοιων
δικτύων όμως δεν φαίνεται να είναι επαρκής για μεγάλου μήκους ακολουθίες, καθώς τα
χαρακτηριστικά που μαθαίνονται στα αρχικά στάδια δεν διατηρούνται, με αποτέλεσμα την απώλεια πληροφορίας. Η εμφάνιση νευρωνικών δικτύων προσοχής όμως, παρουσιάζει την ικανότητα να διαχειρίζεται τέτοιες αδυναμίες και με κύριο αντιπρόσωπο το μοντέλο βαθιάς μάθησης Transformer, όπως ονομάζεται, να πετυχαίνει υψηλές επιδόσεις σε προβλήματα επεξεργασίας φυσικής γλώσσας και computer vision, καθιστώντας αναπόφευκτη την εφαρμογή του και σε άλλους τομείς, όπως η ταξινόμηση χρονοσειρών. Στην έρευνα που ακολουθεί, αναλύεται σχολαστικά ο μηχανισμός προσοχής που αποτελεί θεμέλιο του μοντέλου, καθώς και η εφαρμογή του σε προβλήματα αναγνώρισης ανθρώπινης δραστηριότητας με δεδομένα χρονοσειρών από αισθητήρες κίνησης. Συγκρίνεται με μοντέλα νευρωνικών δικτύων συνέλιξης και ανατροφοδότησης παρουσιάζοντας καλύτερα αποτελέσματα στην ταξινόμηση δραστηριοτήτων και τέλος εξετάζεται κατά πόσο είναι επαρκής
για την αποτελεσματική επίλυση τέτοιων προβλημάτων.
(EL)
Human activity recognition has attracted considerable research interest in the last decade.
In particular, the classification of time series with motion sensor data is the core of several
researches which mainly use deep convolution and recurrent neural networks. However,
the use of such networks does not seem to be sufficient for long sequences, as
the features learned at the initial stages are not preserved, resulting in information loss.
The emergence of attention neural networks, however, shows the ability to handle such
weaknesses and, with the deep learning Transformer model, as it is called, as its main
representative, to achieve high performance in natural language and computer vision processing problems, making its application in other areas, such as time series classification,
inevitable. In the following research, the attention mechanism that is the foundation of
the model is thoroughly analyzed, as well as its application to problems of recognizing
human activity with time series data from motion sensors. It is compared with convolution
and recurrent neural networks models showing better results in activity classification and
finally it is examined whether it is sufficient to effectively solve such problems.
(EN)