Τροποποιημένος αλγόριθμος ομαδοποίησης ομιλητών για την ανίχνευση διαλόγου σε κινηματογραφικές σειρές αναλύοντας το σήμα ομιλίας

 
see the original item page
in the repository's web site and access all digital files if the item*
share
2008 (EN)
Modified speaker clustering algorithm for dialogue detection in movie scenes analyzing the speech signal
Τροποποιημένος αλγόριθμος ομαδοποίησης ομιλητών για την ανίχνευση διαλόγου σε κινηματογραφικές σειρές αναλύοντας το σήμα ομιλίας

Τζιμούλη, Αικατερίνη Ιωάννη

The subject of this thesis is speaker clustering for movie dialogue detection byanalyzing the speech signal. Motivated by a speaker clustering algorithm thatwas developed in previous study, a modified algorithm is proposed, that tries tosolve the problems that were found in the original algorithm. First a survey ofthe related literature is presented that addresses proper metric distance forspeaker clustering and criteria of clustering evaluation. Next the original and themodified algorithm are discussed. The modified speaker clustering algorithmassumes an initial number of clusters. The following cluster evaluationmeasures are used: the average cluster purity, the average speaker purity, thetotal classification error, the Rand index and the metric BBN when differentparameter values are employed in the proposed algorithm. Finally, the results ofmodified algorithm are demonstrated by diagrams for visual assessment.
Το θέμα της διατριβής αυτής είναι η ομαδοποίηση ομιλητών απόκινηματογραφικές σειρές αναλύοντας το σήμα ομιλίας. Συγκεκριμέναπαρουσιάζεται ο αλγόριθμος ομαδοποίησης ομιλητών που αναπτύχθηκε σεπροηγούμενη μελέτη και προτείνεται ο τροποποιημένος αλγόριθμοςομαδοποίησης ομιλητών που προσπαθεί να αντιμετωπίσει τα προβλήματα πουεντοπίζονται. Αρχικά γίνεται μελέτη της βιβλιογραφίας που αφορά στιςμετρικές απόστασης που χρησιμοποιήθηκαν στον τροποποιημένο αλγόριθμοομαδοποίησης ομιλητών και στα κριτήρια αξιολόγησης του. Στη συνέχειαγίνεται παρουσίαση των βημάτων των δύο αλγορίθμων. Ο τροποποιημένοςαλγόριθμος ομαδοποίησης ομιλητών κάνει μία υπόθεση για τον αρχικό αριθμότων ομάδων. Ο αλγόριθμος αξιολογείται με τη μέση καθαρότητα ομάδων, τημέση καθαρότητα ομιλητών, το συνολικό σφάλμα ταξινόμησης, το δείκτη Randκαι τη μετρική BBN και μελετάται η συμπεριφορά του για διάφορες τιμές τωνπαραμέτρων που απαιτεί. Τέλος παρουσιάζονται τα αποτελέσματα τουτροποποιημένου αλγορίθμου και παρατίθενται διαγράμματα για την εποπτικήαξιολόγηση των ομάδων που προκύπτουν.

info:eu-repo/semantics/masterThesis
Postgraduate Thesis / Μεταπτυχιακή Εργασία

Modified algorithm
Criteria of evaluation
Ομαδοποίηση ομιλητών
Πολυμεταβλητή κλιμάκωση
Κριτήρια αξιολόγησης
Τροποποιημένος αλγόριθμος
Μετρικές αποστάσεις
Multidimensional scaling
Speaker clustering
Distance metrics

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (EL)
Aristotle University of Thessaloniki (EN)

Greek
English

2008
2009-06-21T21:00:00Z


Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής

This record is part of 'IKEE', the Institutional Repository of Aristotle University of Thessaloniki's Library and Information Centre found at http://ikee.lib.auth.gr. Unless otherwise stated above, the record metadata were created by and belong to Aristotle University of Thessaloniki Library, Greece and are made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). Unless otherwise stated in the record, the content and copyright of files and fulltext documents belong to their respective authors. Out-of-copyright content that was digitized, converted, processed, modified, etc by AUTh Library, is made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). You are kindly requested to make a reference to AUTh Library and the URL of the record containing the resource whenever you make use of this material.
info:eu-repo/semantics/openAccess*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)