Scalable semi-supervised structure learning for event recognition

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Κλιμακούμενη ημι-επιβλεπόμενη σχεσιακή μηχανική μάθηση για αναγνώριση γεγονότων
Scalable semi-supervised structure learning for event recognition

Michelioudakis, Evangelos
Μιχελιουδάκης, Ευάγγελος

PhD Thesis

2023


Symbolic event recognition systems often rely on knowledge bases of event definitions, expressed in first-order logic, to detect event occurrences over time. Logical frameworks for representing and reasoning about events provide robust temporal reasoning and enable the automated discovery of event rules via Inductive Logic Programming (ILP). Although existing structure learning approaches ease the discovery of such rules in noisy data streams, they assume the existence of fully-labelled training sequences, which is unrealistic for most real-life applications. In this thesis we address the issue of scalable semi-supervised learning for event recognition. We propose two novel techniques for inferring the missing supervision on training sequences and enable learning event rules in the Event Calculus. First, we propose SPLICE, a framework that employs a graph-based method to derive labels for unlabelled data, based on their distance to their labelled counterparts. In order to adapt the graph-based method to first-order logic, we use a suitable structural distance for measuring the distance between sets of logical atoms. The labelling process is achieved online (single-pass) by means of a caching mechanism and the Hoeffding bound for filtering contradicting examples. However, SPLICE labelling may be compromised since its structural measure is agnostic of the feature semantics. Moreover, there is no guarantee about the quality of the labelling found in the local graphs that are built as the data stream in. To that end, we also propose SPLICE+, a second method that improves upon SPLICE by employing a hybrid measure combining an optimised structural distance, and a data-driven one. The former is guided by feature selection, while the latter is a mass-based dissimilarity. In addition, SPLICE+ improves the graph construction process, by storing a synopsis of the past, in order to achieve more informed labelling on the local graphs. We evaluate our approach on the task of complex event recognition by using a benchmark dataset for human activity recognition, a dataset for maritime monitoring, as well as a dataset for fleet management.
Η συμβολική αναγνώριση γεγονότων συχνά βασίζεται σε μια βάση γνώσης, η οποία περιέχει κανόνες εκφρασμένους σε λογική πρώτης τάξης, και χρησιμοποιείται για την αναγνώριση γεγονότων σε ροές δεδομένων. Τέτοια λογικά συστήματα αναγνώρισης γεγονότων προσφέρουν εύρωστο χρονικό συμπερασμό και επιτρέπουν την αυτόματη κατασκευή κανόνων με τη χρήση Επαγωγικού Λογικού Προγραμματισμού. Παρότι οι υπάρχουσες μέθοδοι για την εκμάθηση σχεσιακών δομών διευκολύνουν την εύρεση τέτοιων κανόνων σε θορυβώδεις ροές δεδομένων, υποθέτουν ότι τα δεδομένα εκμάθησης είναι πλήρως επισημειωμένα, πράγμα το οποίο είναι μη ρεαλιστικό σε πραγματικές εφαρμογές. Σε αυτή τη διατριβή επιχειρούμε να αντιμετωπίσουμε το πρόβλημα της κλιμακούμενης ημί-επιπλεπόμενης μάθησης για αναγνώριση γεγονότων. Προτείνουμε δύο καινούργιες τεχνικές για να συμπεραίνουμε τις απούσες επισημειώσεις στα δεδομένα εκπαίδευσης και να μαθαίνουμε κανόνες εκφρασμένους σε Λογισμό Γεγονότων. Το SPLICE είναι ένα σύστημα το οποίο χρησιμοποιεί γράφους για να εξάγει επισημειώσεις για τα μη-επισημειωμένα δεδομένα με βάση τις αποστάσεις τους από τα αντίστοιχα επισημειωμένα. Για να εφαρμόσουμε τη μέθοδο αυτή σε λογική πρώτης τάξης, χρησιμοποιούμε μια απόσταση για σχεσιακές δομές η οποία μετράει την απόσταση μεταξύ λογικών ατόμων. Η διαδικασία της επισημείωσης των δεδομένων γίνεται σε ένα πέρασμα με χρήση ενός μηχανισμού μνήμης και του Hoeffding bound για να φιλτράρουμε αντικρουόμενα παραδείγματα. Παρόλα αυτά το SPLICE, βασίζεται σημαντικά στη μετρική που υπολογίζει τις αποστάσεις μεταξύ των λογικών ατόμων. Επιπλέον, δεν υπάρχει καμία εγγύηση για την ποιότητα των λύσεων στους τοπικούς γράφους που κατασκευάζονται από τη ροή δεδομένων. Συνεπώς, προτείνουμε μια δεύτερη μέθοδο, το SPLICE+, η οποία χρησιμοποιεί μια υβριδική απόσταση που συνδυάζει μια βελτιστοποιημένη απόσταση σχεσιακών δομών και μια απόσταση που βασίζεται στη μάζα των δεδομένων. Η πρώτη καθοδηγείται από μια επιλογή χαρακτηριστικών, ενώ η δεύτερη στην εκτίμηση της μάζα των δεδομένων. Επιπλέον, το SPLICE+ βελτιώνει την κατασκευή του γράφου με το να αποθηκεύει μια σύνοψη του παρελθόντος ώστε να πετύχει καλύτερες επισημειώσεις στους τοπικούς γράφους. Αξιολογούμε τις μεθόδους μας σε εφαρμογές σύνθετης αναγνώρισης γεγονότων χρησιμοποιώντας ένα σύνολο δεδομένων για αναγνώριση ανθρώπινων δραστηριοτήτων, ένα για αναγνώριση ναυτιλιακών συμβάντων και ένα για τη διαχείριση εμπορικών οχημάτων.

Επιστήμες Μηχανικού και Τεχνολογία ➨ Επιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ ➨ Αυτοματισμοί και Συστήματα ελέγχου

Event recognition
Επιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ
Electrical Engineering, Electronic Engineering, Information Engineering
Ημι-επιβλεπόμενη μηχανική μάθηση
Αναγνώριση γεγονότων
Αποστάσεις μάζας
Διάδοση επισημειώσεων σε γράφους
First-order logic distance
Label propagation
Mass dissimilarity
Επιστήμες Μηχανικού και Τεχνολογία
Event calculus
Engineering and Technology
Μάθηση μετρικών συναρτήσεων
Λογισμός γεγονότων
Semi-supervised structure learning
Automation and control systems
Metric learning
Αυτοματισμοί και Συστήματα ελέγχου
Αποστάσεις για λογική πρώτης τάξης

Αγγλική γλώσσα

National and Kapodistrian University of Athens
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών (ΕΚΠΑ)

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών (ΕΚΠΑ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής και Τηλεπικοινωνιών




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.