Πρόβλεψη και αναγνώριση της συναισθηματικής κατάστασης και ατμόσφαιρας στη μουσική με τη χρήση νευρωνικών δικτύων.

This item is provided by the institution :
/aggregator-openarchives/portal/institutions/uoa   

Repository :
Πέργαμος   

see the original item page
in the repository's web site and access all digital files if the item*



Πρόβλεψη και αναγνώριση της συναισθηματικής κατάστασης και ατμόσφαιρας στη μουσική με τη χρήση νευρωνικών δικτύων.

Καλαγκάτσης Αντώνης (EL)
Kalagkatsis Antonis (EN)

born_digital_postgraduate_thesis
Διπλωματική Εργασία (EL)
Postgraduate Thesis (EN)

2023


Στη σημερινή εποχή η χρήση μοντέλων μηχανικής μάθησης ολοένα και ενσωματώνεται σε τεχνολογικές εφαρμογές που χρησιμοποιούμε καθημερινά. Καθώς η τεχνολογία ενσωματώνει αλγορίθμους μηχανικής μάθησης για την αυτοματοποίηση προβλέψεων και λήψης αποφάσεων μιμούμενη ανθρώπινες λειτουργίες, δημιουργούνται μετατοπίσεις στους τρόπους με τους οποίους αποδίδουμε σημασία και νόημα στην πληροφορία που καταναλώνουμε ως χρήστες ή δέκτες αυτής. Η μελέτη αυτή εστιάζει στη νοηματοδότηση πληροφορίας της ηχητικής εμπειρίας και της μουσικής. Ερευνά την έννοια της ετικέτας ως διεπαφή μέσα από το πρίσμα των σύγχρονων υπηρεσιών ροής μουσικής και παράλληλα τη μετατόπιση της σημασιολογίας αυτής από το μουσικό γένος στην ψυχική διάθεση. Εξετάζει την επίδραση που έχουν οι υπηρεσίες να ενσωματώνουν αλγορίθμους μηχανικής μάθησης στη σημασιολογία της ετικέτας ως ταυτότητας στη μουσική και την ηχητική εμπειρία. Μελετά την έννοια του μουσικού γένους ως ετικέτας και το σταδιακό μετασχηματισμό του σε μία ρευστή έννοια όπως είναι η περιγραφή τηςψυχικής κατάστασης/ψυχικής διάθεσης. Παράλληλα, αναλύει σε βάθος τους τρόπους με τους οποίους αξιολογούμε την ηχητική εμπειρία και το πώς διαμορφώνεται η έννοια της ακουστικής αντίληψης από τον άνθρωπο. Η παρούσα έρευνα φιλοδοξεί να εισαγάγει μία νέα ταυτότητα νοηματοδότησης της ηχητικής εμπειρίας που είναι το Vibe Caption ως μία διεπαφή που περιγράφει την πιθανή συναισθηματική κατάσταση ή την ατμόσφαιρα ενός τόπου, όπως αυτή θα μπορούσε να μεταδοθεί στους άλλους και να γίνει αισθητή από αυτούς. Η λύση που προτείνεται μέσα από αυτή τη μελέτη είναι η δημιουργία ενός ηχητικού ταξινομητή με τη χρήση Deep learning αλγορίθμων και συνελικτικών νευρωνικών δικτύων. Επιβεβαιώνεται πως η χρήση συνελικτικών νευρωνικών δικτύων μπορεί να προβλέψει χαρακτηριστικά στη μουσική όπως η ανθρώπινη ακουστική αντίληψη. H συνεισφορά της έρευνας εστιάζει στη χρήση συνελικτικών δικτύων για την εξαγωγή χαρακτηριστικών μέσα από το ηχητικό σήμα. Στο πλαίσιο της ανάπτυξης του απαραίτητου λογισμικού, η έρευνα συνεισφέρει μία ολοκληρωμένη λύση αγωγού λογισμικού για την επαναλαμβανόμενη εκτέλεση πειραμάτων μηχανικής μάθησης με χρήση τεχνητών νευρωνικών δικτύων. Η μεθοδολογία ανάπτυξης εστιάζει στην τεχνική σχεδιασμού λογισμικού συνεχούς ενσωμάτωσης κώδικα και φιλοδοξεί να δημοσιευθεί προς ελεύθερη χρήση ως λογισμικό ανοιχτού κώδικα. Λόγω υλικοτεχνικών και χρονικών περιορισμών για την τέλεση της μελέτης αυτής, το μεθοδολογικό μέρος κατάφερε να υλοποιήσει έναν ηχητικό ταξινομητή που αναγνωρίζει το μουσικό γένος ως κλάση πρόβλεψης με 95% ακρίβεια στο σύνολο δεδομένων εκπαίδευσης. (EL)
In today's world, the use of machine learning models is being increasingly incorporated into technological applications that we use on a daily basis. As technology incorporates machine learning algorithms to automate prediction and decision-making by imitating human operations, the ways in which we attach meaning and significance to the information we consume as users or receivers have been fundamentally reshaped. This study focuses on the information meaning-making of sound experience and music. It explores the notion of the label as an interface through the lens of contemporary music streaming services, while also exploring the shift of this semantics from music genre to mood. It examines the impact that services incorporating machine learning algorithms have on the semantics of tagging as identity in music and sound experience. It studies the notion of music genre as a label and its gradual transformation into a fluid concept such as the description of the mood state. At the same time, it analyses in depth the ways in which we evaluate sound experience and how the concept of auditory perception is being formed by humans. This research aspires to introduce a new identity of signification of sound experience which is the Vibe Caption as an interface that describes the possible emotional state or atmosphere of a place, as it could be transmitted to and felt by others. The solution proposed through this study is the creation of an audio classifier by using Deep Learning algorithms and convolutional neural networks. It is confirmed that the use of convolutional neural networks can predict features in music like human auditory perception. The contribution of the research focuses on the use of convolutional networks to extract features from within the audio signal. In the context of developing the necessary software, the research contributes an integrated software pipeline solution for the repeated execution of machine learning experiments by using artificial neural networks. The development methodology focuses on the continuous code integration software design technique and aspires to be published for free use as an open source software. Due to major logistical constraints in carrying out the conducting of the course of this study, the methodological part managed to implement a sound classifier that identifies the music genre as a prediction class with 95% accuracy on the training dataset. (EN)

Κοινωνικές, Πολιτικές και Οικονομικές επιστήμες

Κοινωνικές, Πολιτικές και Οικονομικές επιστήμες (EL)
Social, Political and Economic sciences (EN)

Greek
English

Βιβλιοθήκη και Κέντρο Πληροφόρησης » Βιβλιοθήκη Σχολής Οικονομικών και Πολιτικών Επιστημών » Βιβλιοθήκη Πολιτικής Επιστήμης και Δημόσιας Διοίκησης - Επικοινωνίας και Μέσων Μαζικής Ενημέρωσης - Τουρκικών Σπουδών και Σύγχρονων Ασιατικών Σπουδών - Κοινωνιολογίας
Σχολή Οικονομικών και Πολιτικών Επιστημών » Τμήμα Επικοινωνίας και Μέσων Μαζικής Ενημέρωσης » ΠΜΣ Ψηφιακά Μέσα Επικοινωνίας και Περιβάλλοντα Αλληλεπίδρασης » Κατεύθυνση Ψηφιακά Μέσα Επικοινωνίας και Περιβάλλοντα Αλληλεπίδρασης

https://creativecommons.org/licenses/by-nc/4.0/




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)