This item is provided by the institution :

Repository :
National Archive of PhD Theses
see the original item page
in the repository's web site and access all digital files if the item*
share



PhD thesis (EN)

1986 (EN)
ΝΕΑ ΜΕΘΟΔΟΣ ΑΥΤΟΜΑΤΗΣ ΑΝΑΓΝΩΡΙΣΗΣ ΟΜΙΛΗΤΗ
A NEW METHOD OF AUTOMATIC SPEAKER RECOGNITION

ΦΑΚΩΤΑΚΗΣ, ΝΙΚΟΛΑΟΣ

ΣΤΗ ΔΙΑΤΡΙΒΗ ΠΑΡΟΥΣΙΑΖΕΤΑΙ ΜΙΑ ΝΕΑ ΜΕΘΟΔΟΣ ΑΥΤΟΜΑΤΗΣ ΑΝΑΓΝΩΡΙΣΕΩΣ ΟΜΙΛΗΤΗ (ΕΞΑΚΡΙΒΩΣΕΩΣ ΚΑΙ ΕΠΙΒΕΒΑΙΩΣΕΩΣ), ΠΟΥ ΒΑΣΙΖΕΤΑΙ ΣΕ ΕΙΔΙΚΑ ΕΠΙΛΕΓΜΕΝΟ ΚΕΙΜΕΝΟ ΟΜΙΛΙΑΣ. ΤΟ ΚΕΙΜΕΝΟ ΑΠΟΤΕΛΕΙΤΑΙ ΑΠΟ ΠΡΟΤΑΣΗ (# ΠΡΟΤΑΣΕΙΣ) ΣΤΗΝ ΟΠΟΙΑ ΕΝΑΛΛΑΣΣΟΝΤΑΙ ΗΧΗΡΟΙ ΚΑΙ ΑΦΩΝΟΙ ΦΘΟΓΓΟΙ. ΟΙ ΗΧΗΡΟΙ ΦΘΟΓΓΟΙ ΑΠΟΤΕΛΟΥΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΣΗΜΕΙΑ ΤΟΥ ΣΗΜΑΤΟΣ ΟΜΙΛΙΑΣ, ΑΠΟ ΤΑ ΟΠΟΙΑ ΕΞΑΓΟΝΤΑΙ ΟΙ 3 ΠΡΩΤΕΣ ΣΥΧΝΟΤΗΤΕΣ ΣΥΝΤΟΝΙΣΜΟΥ ΤΗΣ ΦΩΝΗΤΙΚΗΣ ΟΔΟΥ, ΠΟΥ ΧΡΗΣΙΜΟΠΟΙΟΥΝΤΑΙ ΩΣ ΠΑΡΑΜΕΤΡΟΙ ΑΝΑΓΝΩΡΙΣΕΩΣ. ΕΑΝ Κ ΕΙΝΑΙ ΟΙ ΗΧΗΡΟΙ ΦΘΟΓΓΟΙ ΤΟΥ ΚΕΙΜΕΝΟΥ, ΤΟ ΠΑΡΑΜΕΤΡΙΚΟ ΔΙΑΝΥΣΜΑ ΑΝΑΓΝΩΡΙΣΕΩΣ ΕΧΕΙ ΔΙΑΣΤΑΣΕΙΣ 3Κ. ΒΑΣΙΚΟ ΓΝΩΡΙΣΜΑ ΤΗΣ ΝΕΑΣ ΜΕΘΟΔΟΥ ΕΙΝΑΙ ΟΤΙ ΧΡΗΣΙΜΟΠΟΙΕΙ ΜΟΝΟ 3ΚΠΑΡΑΜΕΤΡΟΥΣ ΑΠΟ ΟΛΟΚΛΗΡΟ ΤΟ ΣΗΜΑ ΟΜΙΛΙΑΣ ΚΑΙ ΟΧΙ ΤΗΝ ΠΛΗΡΗ ΧΡΟΝΙΚΗ ΜΕΤΑΒΟΛΗ ΤΩΝ ΣΥΧΝΟΤΗΤΩΝ ΣΥΝΤΟΝΙΣΜΟΥ, ΟΠΩΣ ΑΝΑΛΟΓΕΣ ΜΕΘΟΔΟΙ. ΕΠΙΣΗΣ ΔΕΝ ΑΠΑΙΤΕΙ ΧΡΟΝΙΚΗ ΑΝΤΙΣΤΟΙΧΙΣΗ (TIME WARPING) ΤΩΝ ΣΗΜΑΤΩΝ ΑΝΑΦΟΡΑΣ ΚΑΙ ΔΟΚΙΜΗΣ. ΑΥΤΑ ΕΧΟΥΝ ΩΣ ΣΥΝΕΠΕΙΑ ΣΗΜΑΝΤΙΚΗ ΜΕΙΩΣΗ ΤΟΥ ΑΠΑΙΤΟΥΜΕΝΟΥ ΟΓΚΟΥ ΜΝΗΜΗΣ ΓΙΑ ΤΑ ΔΕΔΟΜΕΝΑ ΑΝΑΦΟΡΑΣ ΚΑΙ ΔΟΚΙΜΗΣ ΚΑΙ ΑΥΞΗΣΗ ΤΗΣ ΤΑΧΥΤΗΤΑΣ ΑΠΟΚΡΙΣΗΣ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ. Η ΝΕΑ ΜΕΘΟΔΟΣ ΧΡΗΣΙΜΟΠΟΙΕΙ ΠΑΡΑΛΛΗΛΑ ΜΕ ΓΝΩΣΤΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ, ΝΕΟΥΣ 'Η ΒΕΛΤΙΩΜΕΝΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΣΕ ΒΑΣΙΚΑ ΤΜΗΜΑΤΑ ΤΗΣ ΔΙΑΔΙΚΑΣΙΑΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΣΗΜΑΤΟΣ ΟΜΙΛΙΑΣ ΚΑΙ ΜΕΧΡΙ ΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΣ, ΟΠΩΣ ΕΙΝΑΙ Η ΑΝΙΧΝΕΥΣΗ ΤΩΝ ΑΚΡΩΝ ΤΟΥ ΚΕΙΜΕΝΟΥ ΣΤΟ ΣΗΜΑ ΟΜΙΛΙΑΣ, Η ΕΞΑΓΩΓΗ ΤΩΝ ΣΥΝΤΟΝΙΣΜΩΝ (FORMANTS), Η ΕΞΟΜΑΛΥΝΣΗ ΤΗΣ ΧΡΟΝΙΚΗΣ ΣΥΝΑΡΤΗΣΕΩΣ ΤΩΝ ΣΥΝΤΟΝΙΣΜΩΝ, Η ΑΥΤΟΜΑΤΗ ΤΕΜΑΧΙΟΠΟΙΗΣΗ ΤΟΥ ΣΗΜΑΤΟΣ, Ο ΠΡΟΣΔΙΟΡΙΣΜΟΣ ΤΟΥ ΚΑΤΩΦΛΙΟΥ ΑΠΟΦΑΣΗΣ ΚΑΙ Ο ΕΠΑΝΑΠΡΟΣΔΙΟΡΙΣΜΟΣ ΤΩΝ ΔΕΔΟΜΕΝΩΝ ΑΝΑΦΟΡΑΣ.
THE THESIS PRESENTS A NEW METHOD FOR AN AUTOMATIC SPEAKER RECOGNITION SYSTEM, WHICH COULD BE FAVORABLY IMPLEMENTED FOR IDENTIFICATION AS WELL AS FOR VERIFICATION PURPOSES. THIS METHOD IS BASED ON A SUBSTANTIALLY REDUCED NUMBER OF ELEMENTS OF THE PATTERN VECTOR IN COMPARISON TO SIMILAR METHODS. THE ELEMENTS ARE FREQUENCIES OF THE FIRST THREE FORMANTS WHICH CORRESPOND TO CHARACTERISTIC PEAKS OF THE ENERGY-TIME TRAJECTORY OF THE SPEECH SIGNAL AND ARE EXTRACTED AUTOMATICALLY WITHOUT PREVIOUS WARPING OF THE SPEECH SIGNAL. THE SPEECH EVENTS ARE LOCATED TAKING INTO ACCOUNT THE DISTANCE BETWEEN ADJACENT EXTREMES AND THEIR ENERGIES. IT SHOULD BE NOTICED THAT THE UTTERANCE IS SPECIALLY CHOSEN TO PRESENT THE DISTINCTIVE EXTREMES (SPEECH EVENTS).

ΑΥΤΟΜΑΤΗ ΜΕΘΟΔΟΣ ΑΝΑΓΝΩΡΙΣΕΩΣ ΟΜΙΛΗΤΗ
Επιβεβαίωση ομιλητή
SPEAKER IDENTIFICATION
Αναγνώριση ομιλητή
AUTOMATIC SPEAKER RECOGNITION
Speaker recognition
ΕΞΑΚΡΙΒΩΣΗ ΟΜΙΛΗΤΗ
Speaker verification

Εθνικό Κέντρο Τεκμηρίωσης (ΕΚΤ) (EL)
National Documentation Centre (EKT) (EN)

1986


Πανεπιστήμιο Πατρών
University of Patras



*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)