Εκφώνηση Κειμένου από Η/Υ (Text To Speech) για την Ελληνική Γλώσσα

RDF 

 
This item is provided by the institution :
University of Crete
Repository :
E-Locus Institutional Repository
see the original item page
in the repository's web site and access all digital files if the item*
share



Semantic enrichment/homogenization by EKT
1996 (EN)
Εκφώνηση Κειμένου από Η/Υ (Text To Speech) για την Ελληνική Γλώσσα

Σουρλαντζής, Ιωάννης (EL)
Sourlantzis, John (EN)

Α. Τραγανίτης

Text-to-Speech systems have recently become a standard part of integrated enviroments (MS-Windows, Macintosh). TTS systems are useful at telephone provided services (e-mail, telex, database transactions), for aiding people with hearing or speaking problems, for verifying documents etc. Existing TTS systems are based on modeling human speech production system, or the produced speech signal. Concatenative TTS systems produce speech by concatenating speech elements (phomenes, phones, syllables etc). Our TTS system for greek produces speech by concatenating intersyllables. Intersyllable is the portion of speech begining at the middle of a vowel and ending at the middle of the next one. The choice was driven by the characteristics of greek accent which uses many vowels. Approximately 6000 intersyllables are necessary for the synthesis of all greek words. Power smoothing is used during concatenation. Phonetic words are made up by rule-based concatenation of small words with their neighboring ones. Pitch contour is constructed for declarative, yes/no questions, and wh-questions. A systematic method for the construction of the intersyllables-base is also described. (EL)
Τα τελευταία χρόνια, τα συστήματα εκφώνησης κειμένου από Η/Υ (Text-To-Speech) έχουν αρχίσει να εμφανίζονται σαν συνηθισμένο κομμάτι ολοκληρωμένων περιβαλλόντων (MS-Windows, Macintosh). Μερικές από τις εφαρμογές των συστημάτων TTS είναι η παροχή υπηρεσιών μέσω τηλεφώνου (e-mail, telex), η παροχή βοήθειας σε άτομα με προβλήματα στην όραση ή την ομιλία, η ακουστική προσπέλαση βάσεων κειμένου και εκφώνηση οδηγιών. Τα υπάρχοντα συστήματα TTS στηρίζονται στη μοντελοποίηση του ανθρώπινου συστήματος παραγωγής φωνής ή στη μοντελοποίηση του σήματος φωνής. Στη δεύτερη κατηγορία ανήκουν και τα συστήματα που συνθέτουν φωνή συρράπτοντας στοιχειώδη κομμάτια της (πχ φθόγγους, συλλαβές) που ονομάζονται φωνητικές μονάδες. Στα πλαίσια αυτής της εργασίας κατασκευάστηκε ένα σύστημα TTS για την ελληνική γλώσσα βασισμένο στη τεχνική συρραφής φωνητικών μονάδων. Οι φωνητικές μονάδες στο σύστημα μας ονομάστηκαν διασυλλαβές και ορίζονται σαν το τμήμα φωνής από το μέσο ενός φωνήεντος μέχρι το μέσο του επόμενου. Η επιλογή αυτή έχει άμεση σχέση με τα χαρακτηριστικά της ελληνικής γλώσσας η οποία περιέχει πολλά και καθαρά στη προφορά φωνήεντα. Έτσι η συρραφή γίνεται πάντα μεταξύ φωνηέντων γι' αυτό και οι ασυνέχειες που πρέπει να εξομαλυνθούν δεν απαιτούν μεγάλη επεξεργασία. Στο σύστημα ελέγχεται η προσωδία της φωνής (τονικότητα, διάρκεια, ένταση) για την έκφραση οριστικών και ερωτηματικών προτάσεων αλλά και την φυσικότερη έκφραση της ομιλίας. Επίσης περιγράφεται και υλοποιείται ένας συστηματικός τρόπος κατασκευής της βάσης διασυλλαβών για την σύνθεση των ελληνικών λέξεων. (EN)

text

α) Δίκτυα Υπολογιστών και Ψηφιακές Επικοινωνίες, β) Μηχανική Οραση και Ρομποτική

Πανεπιστήμιο Κρήτης (EL)
University of Crete (EN)

1996-11-01
1997-06-2




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)