Αρχιτεκτονικές και Εκπαίδευση Βαθιών Νευρωνικών Δικτύων

 
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2016 (EL)
Αρχιτεκτονικές και Εκπαίδευση Βαθιών Νευρωνικών Δικτύων

Τσαντεκίδης, Αβραάμ

Στην εργασία αυτή αναλύεται η θεωρία, οι τεχνικές και η υλοποίηση των νευρωνικών δικτύων, που ανήκουν στον τομέα της μηχανικής μάθησης. Εξετάζονται απο τα πιο απλά μοντέλα οπως η γραμμική και η λογιστική παλινδρόμηση έως και τα πιο σύνθετα όπως είναι τα συνελικτικά και τα ανατροφοδοτούμενα νευρωνικά δίκτυα. Διερευνώνται πολλά από τα εργαλεία που έχουν δημοσιευθεί μεχρι σήμερα, τα οποία είτε βελτιώνουν την ταχύτητα μάθησης των νευρωνικών δικτύων (όπως ο αλγόριθμος ADAM) είτε εξομαλύνουν το πρόβλημα της υπερεκπαίδευσης (όπως η τεχνική της κανονικοποίησης παρτίδας) είτε βελτιώνουν την ακρίβεια των τελικών αποτελεσμάτων των δικτύων (όπως ο μηχανισμός της έμφασης και η θορυβώδης παράγωγος). Αφού δοθεί η εικόνα των τελευταίων εξελίξεων, παρατίθενται τα υπολογιστικά εργαλεία που χρησιμοποιούνται για την υλοποίηση των μοντέλων με νευρωνικά δίκτυα. Τέλος, παρουσιάζονται κάποια πειράματα που χρησιμοποιούν τα μοντέλα που περιγράφηκαν πάνω σε δεδομένα όπως το σετ εικόνων MNIST αλλά και δεδομένα χρονοσειρών από τα ανταλλακτήρια ψηφιακών νομισμάτων bitcoin.
In this work, a subfield of machine learning known as "neural networks" is analyzed, along with its implementation and useful techniques. The neural network models that are presented range from simple from simple linear and logistic regression up to more complicated models like convolutional and recurrent neural networks. Many recently published techniques are also established and explained such as a learning algorithm based on adaptive moment estimation (ADAM), multiple method to reduce the overfitting problem (Dropout and Batch Normalization) and intuitive methods to increase the accuracy of the predictions produced by the neural networks (attention mechanism and noisy gradient). After these methods are explained, the tools required for their implementation are demonstrated with brief code samples. Finally, some representative experiments, based on the MNIST dataset and a time-series of the price of bitcoins, are formulated and their results are showcased and discussed.

info:eu-repo/semantics/bachelorThesis
Graduate Thesis / Πτυχιακή Εργασία

Μηχανική Μάθηση
Τεχνητή Νοημοσύνη
Artificial Intelligence
Neural Networks
Νευρωνικά Δίκτυα
Machine Learning

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (EL)
Aristotle University of Thessaloniki (EN)

Ελληνική γλώσσα

2016
2016-10-25T08:44:43Z


Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής

This record is part of 'IKEE', the Institutional Repository of Aristotle University of Thessaloniki's Library and Information Centre found at http://ikee.lib.auth.gr. Unless otherwise stated above, the record metadata were created by and belong to Aristotle University of Thessaloniki Library, Greece and are made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). Unless otherwise stated in the record, the content and copyright of files and fulltext documents belong to their respective authors. Out-of-copyright content that was digitized, converted, processed, modified, etc by AUTh Library, is made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). You are kindly requested to make a reference to AUTh Library and the URL of the record containing the resource whenever you make use of this material.
info:eu-repo/semantics/openAccess



*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.