Διαχωρισμός Ανθρώπου-Παρασκηνίου με Βαθιά Νευρωνικά Δίκτυα

Το τεκμήριο παρέχεται από τον φορέα :
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών   

Αποθετήριο :
Πέργαμος   

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Διαχωρισμός Ανθρώπου-Παρασκηνίου με Βαθιά Νευρωνικά Δίκτυα

ΚΑΒΒΑΔΙΑΣ ΔΙΟΝΥΣΙΟΣ (EL)
KAVVADIAS DIONYSIOS (EN)

born_digital_graduate_thesis
Πτυχιακή Εργασία (EL)
Graduate Thesis (EN)

2020


Στην εργασία αντιμετωπίζουμε το πρόβλημα του διαχωρισμού ενός ανθρώπου από μια εικόνα. Παρουσιάζουμε την γενική εικόνα του προβλήματος, τι σημαίνει διαχωρισμός και γιατί τα μαθηματικά μοντέλα δεν είναι ικανά να δώσουν μια καλή λύση στο πρόβλημα και πρέπει να στραφούμε στην τεχνητή νοημοσύνη. Ωστόσο και εκεί τα πράγματα είναι πιο σύνθετα καθώς πρέπει να αναδείξουμε γιατί οι τωρινές αντιμετωπίσεις με νευρωνικά δίκτυα δεν δουλεύουν και τι προσφέρει το νευρωνικό δίκτυο που προτείνεται. Σε ένα δεύτερο κομμάτι παρουσιάζονται οι τεχνικές λεπτομέρειες πάνω στα συνελικτικά νευρωνικά δίκτυα, την δομής τους και πώς εκπαιδεύονται. Η εξήγηση κάποιων σημείων αποδίδεται με διαισθητικά αποτελέσματα καθώς τα μαθηματικά δεν είναι σε θέση να μας εξηγήσουν πάντα γιατί λειτουργεί κάτι ή γιατί είναι καλύτερη μια υλοποίηση σε σχέση με κά- ποια άλλη. Στο κομμάτι της εκπαίδευσης που είναι πολύ σημαντική, παραθέτουμε κάποιες βασικές ορολογίες και πώς από βασικές ιδέες αναπτύσσονται μέθοδοι εκπαίδευσης που κάνουν την δουλειά του ερευνητή πιο γρήγορη με την απαίτηση λιγότερων υπολογιστικών πόρων. Στο τελευταίο μέρος ”βουτάμε” βαθιά στην φύση του προβλήματος και στο πώς τα δίκτυα συνεργάζονται για να λύσουν ένα πρόβλημα όπου το τελικό αποτέλεσμα καθορίζεται από την παραμικρή λεπτομέρεια. Το πρακτικό κομμάτι απαιτεί την υλοποίηση 2 μεγάλων δικτύων, την εκπαίδευση τους και την ένωση τους. Η εκπαίδευση απαιτεί τεχνικές που είναι σχετικά πρόσφατες στον τομέα των νευρωνικών δικτύων γι αυτό και είναι σημαντικό να μπορείς να χρησιμοποιείς βιβλιο- θήκες που συμπυκνώνουν αυτήν την γνώση πάνω στις τεχνικές. Εξάλλου ο τομέας των νευρωνικών δικτύων είναι ένας τομέας που πολλές φορές χρειάζεται η εμπειρική δοκιμή προκειμένου να καταλήξεις στο τι λειτουργεί καλύτερα και δεν είναι τετριμμένη χρήση μα- θηματικών. Παράλληλα έπρεπε να βρεθεί ένας τρόπος η ποσότητα των δεδομένων να είναι ικανοποιητική και η ποιότητα τους να είναι τέτοια ώστε να μπορούμε να έχουμε ένα αποτέλεσμα πολύ κοντά στις ανθρώπινες δυνατότητες. Στόχος είναι να δούμε πώς η υπολογιστική όραση έχει φτάσει σε ένα τέτοιο σημείο που μπορούμε να αντιμετωπίσουμε δύσκολα προβλήματα αρκετά αποτελεσματικά και πώς τα δίκτυα μπορούν να συνεργαστούν για να λύνουν δυσκολότερα προβλήματα όπως ακριβώς και οι διαφορετικές ομάδες νευρώνων του εγκεφάλου μας. (EL)
Human matting is the process of separating an image with a person from background. In this thesis we are trying to solve the problem of human matting. We investigate the problem trying to understand how human matting works and why math can't provide a sufficient solution to this problem. Thus we conclude that the use of neural networks is important in order to find a good solution. Using neural networks for human matting needs further investigation because current solutions won't work for a production environment. In the second part we explore Convolutional neural networks architectures and ways of training. Some parts of the network are better explained via examples. In the training part we introduce different concepts of training and we study training methods that make neural network training faster, more accurate and cheaper. In the last part we deep dive into the problem's details trying to understand how the networks cooperate to solve the problem. Training the network in practice requires the training of 2 separate networks and a way to combine them into a final network. Training also requires techniques recently developed so it's always important to use libraries that implement these techniques. Thus you spend less time on developing and more time on testing in practice what better works for your problem. Our goal is to understand that in computer vision field, neural networks are able to solve difficult problems. Their efficiency is mainly based on the fact that we can split the problem in sub tasks and combine smaller networks for each sub task . (EN)

Τεχνολογία – Πληροφορική

Τεχνολογία – Πληροφορική (EL)
Technology - Computer science (EN)

Ελληνική γλώσσα

Βιβλιοθήκη και Κέντρο Πληροφόρησης » Βιβλιοθήκη Σχολής Θετικών Επιστημών » Πληροφορική
Σχολή Θετικών Επιστημών » Τμήμα Πληροφορικής & Τηλεπικοινωνιών

https://creativecommons.org/licenses/by-nc/4.0/




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.