Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) "Επιστήμη Δεδομένων και Μηχανική Μάθηση"
(EL)
Σκοπός της παρούσας μεταπτυχιακής διπλωματικής εργασίας είναι η αναλυτική επεξεργασία δεδομένων
που αφορούν την πρόβλεψη κατανάλωσης ηλεκτρικής ενέργειας μέσω τεχνικών Βαθιάς Μηχανικής
Μάθησης. Δύο σετ δεδομένων λαμβάνονται υπόψη, με το πρώτο να περιέχει τις καταγραφές
κατανάλωσης ηλεκτρικής ενέργειας ενός μετρητή μιας οικίας ανά ένα λεπτό της ώρας ενώ το δεύτερο
τις καταγραφές μιας ομάδας μετρητών μιας γειτονιάς ανά μία ώρα.
Τα δεδομένα λαμβάνονται στην πρωτόλεια μορφή τους και, αφού προηγηθεί διερευνητική στατιστική
ανάλυσή τους, υπόκεινται σε επεξεργασία με διάφορους τρόπους (ενδεικτικά: συμπλήρωση
ελλειπουσών τιμών, δειγματοληψία, απαλοιφή τάσεων μεταβολής των τιμών (detrending), κανονικοποίηση,
κωδικοποίηση ”one hot” κλπ) ώστε να παραχθεί ένα κατάλληλο σύνολο δεδομένων που να
μπορεί να τροφοδοτηθεί με ορθό και αποτελεσματικό τρόπο σε μία διάταξη βαθιάς μάθησης.
Για την διαδικασία τόσο της εκπαίδευσης όσο και της πρόβλεψης των νευρωνικών δικτύων χρησιμοποιείται
η τεχνική του ”κυλιόμενου παραθύρου” (sliding window), σύμφωνα με την οποία το
σύνολο δεδομένων χωρίζεται σε διαδοχικά αλληλοεπικαλυπτόμενα τμήματα δεδομένων σταθερού
(στην περίπτωσή μας) μήκους. Αναλύονται διάφορες τεχνικές διαχωρισμού των δεδομένων (απλός
και πολλαπλός διαχωρισμός σε σύνολα εκπαίδευσης και ελέγχου, διαχωρισμός σε παρτίδες (batches)),
η τεχνική ανακατέματος (shuffling) των παραθύρων καθώς και στρατηγικές πρόβλεψης (αναδρομική,
πολλαπλών εισόδωνπολλαπλών
εξόδων κλπ).
Τα δίκτυα Βαθιάς Μάθησης που χρησιμοποιούνται τελικώς για το έργο της πρόβλεψης περιλαμβάνουν
τα Δίκτυα Πρόσθιας Τροφοδότησης, τα Ανατροφοδοτούμενα Δίκτυα τύπου Elman, τα Φραγμένα
Ανατροφοδοτούμενα Δίκτυα, τα Δίκτυα Μακράς Βραχύχρονης Μνήμης, τα Ακολουθιακά ή Δίκτυα
ΚωδικοποιητήΑποκωδικοποιητή
και τα Χρονικά Συνελικτικά Δίκτυα. Για τα δίκτυα αυτά ελήφθησαν
αποτελέσματα για το ίδιο έργο πρόβλεψης του ηλεκτρικού φορτίου των επόμενων 24 ωρών και οι
επιδόσεις τους συγκρίθηκαν μεταξύ τους. Η εργασία ολοκληρώνεται με προτάσεις βελτίωσης του έργου
της πρόβλεψης, η κυριότερη εκ των οποίων είναι η προσαρμοστική κανονικοποίηση της (όποιας)
χρονοσειράς εισόδου.
(EL)
The purpose of this master’s thesis is the detailed processing of data related to the prediction of
electricity consumption through Deep Machine Learning techniques. Two sets of data are considered,
the first containing the electricity consumption records of a household meter per minute of time and
the second the records of a neighborhood meter group per hour.
The data are taken in their original form and, after their exploratory statistical analysis, are subjected
to processing in various ways (for example: filling in missing values, sampling, eliminating
value trends (detrending), normalization, ”one hot” encoding etc) to produce an appropriate data set
that can be properly and efficiently fed into a deep learning network.
The process of both training and predicting neural networks uses the ”sliding window” technique,
according to which the data set is divided into successively overlapping sections of data of constant
(in our case) length. Various data separation techniques are analyzed (simple and multiple separation
into training and control sets, batch separation), the window shuffling technique as well as prediction
strategies (recursive, multiple input multiple
output, etc.).
The Deep Learning Networks that are ultimately used for the forecasting work include the Feed
Forward Neural Networks, the Elman Recurrent Networks, the Gated Recurrent Networks, the Long
ShortTerm
Memory Networks, the Sequential (or EncoderDecoder)
Networks, and the Temporal
Convolution Networks. For these networks, results were obtained for the same task of forecasting the
electric load of the next 24 hours and their performance was compared with each other. The work
is completed with proposals for improving the task of forecasting, the main of which is the adaptive
normalization of (any) input time series.
(EN)