Ανάκτηση Εικόνας Βασισμένη σε Βαθιά Συνελικτικά Νευρωνικά Δίκτυα

 
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2016 (EL)
Ανάκτηση Εικόνας Βασισμένη σε Βαθιά Συνελικτικά Νευρωνικά Δίκτυα

Κονδυλίδης, Νικόλαος

Το πρόβλημα της ανάκτησης εικόνας αποτελεί μέχρι και σήμερα ένα αρκετά δύσκολο πρόβλημα και θεωρείται ότι ακόμα δεν έχει λυθεί αποτελεσματικά. Οι τελευταίες προσεγγίσεις χρησιμοποιούν τις νευρωνικές ενεργοποιήσεις, κάποιου νευρωνικού επιπέδου, από προεκπαιδευμένα Βαθιά Συνελικτικά Νευρωνικά Δίκτυα για να συγκρίνουν δύο εικόνες μεταξύ τους. Αφού οριστεί η μέθοδος σύγκρισης δύο εικόνων, βρίσκονται οι πιο όμοιες εικόνες μίας συλλογής σε σχέση με μία εικόνα-ερώτημα. Στην παρούσα εργασία μελετώνται και διατυπώνονται νέες προσεγγίσεις που χρησιμοποιούν τις νευρωνικές ενεργοποιήσεις πολλών επιπέδων ενός δικτύου για την σύγκριση. Πιο συγκεκριμένα, μελετάται η χρήση διάφορων συνδυασμών νευρωνικών επιπέδων για χρήση και κάποιες τεχνικές προεπεξεργασίας των νευρωνικών ενεργοποιήσεων που εξάγονται, οι οποίες έχουν ως στόχο την αποτελεσματικότερη σύγκριση δύο εικόνων. Επιπλέον, κάθε νευρώνας του δικτύου έχει εκπαιδευτεί να ενεργοποιείται στην ανίχνευση κάποιας περιγραφικής οντότητας, στην εικόνα εισόδου, και επομένως θεωρούμε ότι η τιμή ενεργοποίησης ενός νευρώνα μας ενημερώνει για τον βαθμό ύπαρξης της περιγραφικής οντότητας, την οποία έχει εκπαιδευτεί να ανιχνεύει. Επιπρόσθετα, όσο αφορά τα συνελικτικά επίπεδα, μελετάμε διάφορους τρόπους απόδοσης μίας τιμής ενεργοποίησης για κάθε συνελικτικό νευρώνα (φίλτρο), η οποία αντικατοπτρίζει το βαθμό ύπαρξης της περιγραφικής οντότητας, που εκπαιδεύτηκε να ανιχνεύει το φίλτρο, σε ολόκληρη την εικόνα. Στη συνέχεια, έχοντας εξάγει τις τιμές των νευρωνικών ενεργοποιήσεων, για όλες τις εικόνες μίας συλλογής, υπολογίζουμε μία τιμή σημαντικότητας περιγραφής για κάθε νευρώνα, η οποία αντικατοπτρίζει το περιγραφικό βάρος των τιμών ενεργοποίησης του συγκεκριμένου νευρώνα, διότι δεν θεωρούμε όλους τους νευρώνες του δικτύου ίσης περιγραφικής αξίας. Τέλος ακολουθούν κάποιες τεχνικές επέκτασης ερωτήματος (Query Expansion) ώστε να βελτιωθούν τα αποτελέσματα ανάκτησης.
The problem of image retrieval remains challenging to this day, as problems regarding the efficiency of developed solutions persist. The most recent strategies employ neural activations, related to a certain neural level, of pre-trained Deep Convolutional Neural Networks, to compare two images. Once the comparison method has been determined, the most relevent images of a collection are found, based on the query image. In this thesis, new approaches using multi-level neural activations are formulated and studied, for the purpose of image comparison. More specifically, we study the use of various combinations of neural layers, together with certain methods of pre-treatment of the occuring neural activations, in order to increase the efficiency of image comparison. Furthermore, each of the network's neurons has been trained to be activated upon the detection of a certain descriptive entity, in the query image, which implies that the activation value of the neuron will be indicative of the degree of existence of the descriptive entity, for which it was trained to recognize. As regards the convolutional layers, we study various ways of rendering one activation value for each convolutional neuron (filter), which would reflect the degree of existence of the descriptive entity, which it was trained to recognize, in the entire image. Then, having recorded the values of neural activations for all the images of a collection, we calculate a description significance value for each neuron, which reflects the descriptive weight of the activation values of this neuron, because we do not consider all the neurons of the network to be equally descriptive. Finally we apply some Query Expansion techniques to improve the retrieval results.

info:eu-repo/semantics/bachelorThesis
Graduate Thesis / Πτυχιακή Εργασία

Image Retrieval
Deep Convolutional Neural Networks
Βαθιά Συνελικτικά Νευρωνικά Δίκτυα
Σημαντικότητα Νευρώνα
Ανάκτηση Εικόνας
Ενεργοποιήσεις Νευρώνων
Neural Activations
Descriptive Significance of Neuron
Combination of Neural Layers
Συνδυασμός Νευρωνικών Επιπέδων

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (EL)
Aristotle University of Thessaloniki (EN)

Ελληνική γλώσσα

2016-10-25T08:14:42Z
2016


Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής

This record is part of 'IKEE', the Institutional Repository of Aristotle University of Thessaloniki's Library and Information Centre found at http://ikee.lib.auth.gr. Unless otherwise stated above, the record metadata were created by and belong to Aristotle University of Thessaloniki Library, Greece and are made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). Unless otherwise stated in the record, the content and copyright of files and fulltext documents belong to their respective authors. Out-of-copyright content that was digitized, converted, processed, modified, etc by AUTh Library, is made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). You are kindly requested to make a reference to AUTh Library and the URL of the record containing the resource whenever you make use of this material.
info:eu-repo/semantics/openAccess



*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.