Σύγκριση αλγορίθμων machine learning για την επιβλεπόμενη ταξινόμηση τηλεσκοπικών δεδομένων

 
Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
Ιδρυματικό Αποθετήριο Ελλάνικος (Hellanicus)
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο





Comparing machine learning algorithms for the classification of remote sensing data (EL)
Σύγκριση αλγορίθμων machine learning για την επιβλεπόμενη ταξινόμηση τηλεσκοπικών δεδομένων (EL)

Κάρλες, Παναγιώτης

aegean

Η χρήση της ταξινόμησης στο κλάδο της Δορυφορικής Τηλεπισκόπησης αποτελεί ένα από τα βασικότερα εργαλεία της διότι, μέσα από αυτή ο ερευνητής μπορεί να εντοπίσει και να χαρτογραφήσει τα αντικείμενα που συνθέτουν την περιοχή μελέτης του. Όμως, για να παραχθούν σημαντικά αποτελέσματα με μικρές αποκλίσεις από την πραγματικότητα θα πρέπει τα στάδια της ταξινόμησης να εκτελεστούν με προσοχή. Σε αυτή την εργασία παρουσιάζεται μια μεθοδολογία σύγκρισης αλγορίθμων ταξινόμησης χρησιμοποιώντας μεθόδους Εκμάθησης Μηχανής και δεδομένα από τον δορυφόρο Sentinel-1 και το αρχείο χρήσεων γης του Corine 2000 για την περιοχή του Κόλπου της Γέρας. Από τα αποτελέσματα σημειώθηκε πως ο καλύτερος αλγόριθμος ταξινόμησης ήταν ο Random Forrest λόγο των τιμών Kappa και Accuracy. Επίσης παρουσιάστηκαν προβλήματα κατά την επεξεργασία των δεδομένων λόγο της υψηλής χωρικής ανάλυσης των δορυφορικών δεδομένων (10m) όπως και της αλγοριθμικής περιπλοκότητας (Big-O) που είχαν οι αλγόριθμοι ταξινόμησης. Αυτό είχε ως αποτέλεσμα τη χρήση χωρικής γενίκευσης των δορυφορικών δεδομένων και κατ επέκταση την απόκλιση των αποτελεσμάτων. Όμως ακόμα και με τη γενίκευση τα λάθη της ταξινόμησης δεν ήταν στατιστικά σημαντικά διότι όταν έγινε σύγκριση της ταξινόμησης του Random Forrest με την ψηφιοποιημένη μορφή των περιοχών μελέτης παρατηρήθηκε πως τα pixel που ταξινομήθηκαν λάθος ελάχιστα, περίπου το ένα εικοστό των δεδομένων.
The use of classification as part of Satellite Remote Sensing has been one of the most important and commonly used tools because with that researchers can detect and map the objects that compose a given area. But the steps of the methodology have to be executed with precision by the researcher, in order to produce results that are close to reality, with minimum statistical error. In this paper, a Machine Learning method for comparison is being presented, between different algorithms of classification by utilizing data from Sentinel-1 and Corine 2000 for the Gulf of Gera. From the results it is obvious that the best classification algorithm is Random Forrest because of its Kappa and Accuracy values. Another part of this paper is dedicated to present the problems that were encountered because of the High Spatial Resolution (10m) as well as the algorithmic complexity (Big-O) from the algorithms that were used. That was the reason for the use of spatial aggregation and part of the errors. Although aggregation was used the error was not very important, statistically speaking, because after the process and the comparison Random Forests classification had an error that was less than one twentieth.

bachelorThesis

Big-o (EN)
Γεωγραφία (EN)
Τηλεπισκόπηση (EN)
Αλγόριθμοι (EN)


2018-06-01


2019-02-12T10:23:21Z




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.