Σύγκριση αλγορίθμων machine learning για την επιβλεπόμενη ταξινόμηση τηλεσκοπικών δεδομένων

This item is provided by the institution :
University of the Aegena   

Repository :
Institutional Repository Hellanicus   

see the original item page
in the repository's web site and access all digital files if the item*



Σύγκριση αλγορίθμων machine learning για την επιβλεπόμενη ταξινόμηση τηλεσκοπικών δεδομένων
Comparing machine learning algorithms for the classification of remote sensing data

Κάρλες, Παναγιώτης

Καβρουδάκης, Δημήτρης
Βαΐτης, Μιχάλης
Τοπουζέλλης, Κωνσταντίνος

bachelorThesis

2019-02-12T10:23:21Z
2018-06-01

Η χρήση της ταξινόμησης στο κλάδο της Δορυφορικής Τηλεπισκόπησης αποτελεί ένα από τα βασικότερα εργαλεία της διότι, μέσα από αυτή ο ερευνητής μπορεί να εντοπίσει και να χαρτογραφήσει τα αντικείμενα που συνθέτουν την περιοχή μελέτης του. Όμως, για να παραχθούν σημαντικά αποτελέσματα με μικρές αποκλίσεις από την πραγματικότητα θα πρέπει τα στάδια της ταξινόμησης να εκτελεστούν με προσοχή. Σε αυτή την εργασία παρουσιάζεται μια μεθοδολογία σύγκρισης αλγορίθμων ταξινόμησης χρησιμοποιώντας μεθόδους Εκμάθησης Μηχανής και δεδομένα από τον δορυφόρο Sentinel-1 και το αρχείο χρήσεων γης του Corine 2000 για την περιοχή του Κόλπου της Γέρας. Από τα αποτελέσματα σημειώθηκε πως ο καλύτερος αλγόριθμος ταξινόμησης ήταν ο Random Forrest λόγο των τιμών Kappa και Accuracy. Επίσης παρουσιάστηκαν προβλήματα κατά την επεξεργασία των δεδομένων λόγο της υψηλής χωρικής ανάλυσης των δορυφορικών δεδομένων (10m) όπως και της αλγοριθμικής περιπλοκότητας (Big-O) που είχαν οι αλγόριθμοι ταξινόμησης. Αυτό είχε ως αποτέλεσμα τη χρήση χωρικής γενίκευσης των δορυφορικών δεδομένων και κατ επέκταση την απόκλιση των αποτελεσμάτων. Όμως ακόμα και με τη γενίκευση τα λάθη της ταξινόμησης δεν ήταν στατιστικά σημαντικά διότι όταν έγινε σύγκριση της ταξινόμησης του Random Forrest με την ψηφιοποιημένη μορφή των περιοχών μελέτης παρατηρήθηκε πως τα pixel που ταξινομήθηκαν λάθος ελάχιστα, περίπου το ένα εικοστό των δεδομένων.
The use of classification as part of Satellite Remote Sensing has been one of the most important and commonly used tools because with that researchers can detect and map the objects that compose a given area. But the steps of the methodology have to be executed with precision by the researcher, in order to produce results that are close to reality, with minimum statistical error. In this paper, a Machine Learning method for comparison is being presented, between different algorithms of classification by utilizing data from Sentinel-1 and Corine 2000 for the Gulf of Gera. From the results it is obvious that the best classification algorithm is Random Forrest because of its Kappa and Accuracy values. Another part of this paper is dedicated to present the problems that were encountered because of the High Spatial Resolution (10m) as well as the algorithmic complexity (Big-O) from the algorithms that were used. That was the reason for the use of spatial aggregation and part of the errors. Although aggregation was used the error was not very important, statistically speaking, because after the process and the comparison Random Forests classification had an error that was less than one twentieth.

Geography
Algorithms
Machine learning
Remote sensing

Γεωγραφία
Τηλεπισκόπηση
Αλγόριθμοι
Big-o

aegean
Πανεπιστήμιο Αιγαίου - Σχολή Κοινωνικών Επιστημών - Τμήμα Γεωγραφίας

CC0 1.0 Παγκόσμια
http://creativecommons.org/publicdomain/zero/1.0/




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)