Εκφώνηση Κειμένου από Η/Υ (Text To Speech) για την Ελληνική Γλώσσα

RDF 

 
Το τεκμήριο παρέχεται από τον φορέα :
Πανεπιστήμιο Κρήτης
Αποθετήριο :
E-Locus Ιδρυματικό Καταθετήριο
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο



Σημασιολογικός εμπλουτισμός/ομογενοποίηση από το EKT
1996 (EL)
Εκφώνηση Κειμένου από Η/Υ (Text To Speech) για την Ελληνική Γλώσσα

Σουρλαντζής, Ιωάννης (EL)
Sourlantzis, John (EN)

Α. Τραγανίτης

Text-to-Speech systems have recently become a standard part of integrated enviroments (MS-Windows, Macintosh). TTS systems are useful at telephone provided services (e-mail, telex, database transactions), for aiding people with hearing or speaking problems, for verifying documents etc. Existing TTS systems are based on modeling human speech production system, or the produced speech signal. Concatenative TTS systems produce speech by concatenating speech elements (phomenes, phones, syllables etc). Our TTS system for greek produces speech by concatenating intersyllables. Intersyllable is the portion of speech begining at the middle of a vowel and ending at the middle of the next one. The choice was driven by the characteristics of greek accent which uses many vowels. Approximately 6000 intersyllables are necessary for the synthesis of all greek words. Power smoothing is used during concatenation. Phonetic words are made up by rule-based concatenation of small words with their neighboring ones. Pitch contour is constructed for declarative, yes/no questions, and wh-questions. A systematic method for the construction of the intersyllables-base is also described. (EL)
Τα τελευταία χρόνια, τα συστήματα εκφώνησης κειμένου από Η/Υ (Text-To-Speech) έχουν αρχίσει να εμφανίζονται σαν συνηθισμένο κομμάτι ολοκληρωμένων περιβαλλόντων (MS-Windows, Macintosh). Μερικές από τις εφαρμογές των συστημάτων TTS είναι η παροχή υπηρεσιών μέσω τηλεφώνου (e-mail, telex), η παροχή βοήθειας σε άτομα με προβλήματα στην όραση ή την ομιλία, η ακουστική προσπέλαση βάσεων κειμένου και εκφώνηση οδηγιών. Τα υπάρχοντα συστήματα TTS στηρίζονται στη μοντελοποίηση του ανθρώπινου συστήματος παραγωγής φωνής ή στη μοντελοποίηση του σήματος φωνής. Στη δεύτερη κατηγορία ανήκουν και τα συστήματα που συνθέτουν φωνή συρράπτοντας στοιχειώδη κομμάτια της (πχ φθόγγους, συλλαβές) που ονομάζονται φωνητικές μονάδες. Στα πλαίσια αυτής της εργασίας κατασκευάστηκε ένα σύστημα TTS για την ελληνική γλώσσα βασισμένο στη τεχνική συρραφής φωνητικών μονάδων. Οι φωνητικές μονάδες στο σύστημα μας ονομάστηκαν διασυλλαβές και ορίζονται σαν το τμήμα φωνής από το μέσο ενός φωνήεντος μέχρι το μέσο του επόμενου. Η επιλογή αυτή έχει άμεση σχέση με τα χαρακτηριστικά της ελληνικής γλώσσας η οποία περιέχει πολλά και καθαρά στη προφορά φωνήεντα. Έτσι η συρραφή γίνεται πάντα μεταξύ φωνηέντων γι' αυτό και οι ασυνέχειες που πρέπει να εξομαλυνθούν δεν απαιτούν μεγάλη επεξεργασία. Στο σύστημα ελέγχεται η προσωδία της φωνής (τονικότητα, διάρκεια, ένταση) για την έκφραση οριστικών και ερωτηματικών προτάσεων αλλά και την φυσικότερη έκφραση της ομιλίας. Επίσης περιγράφεται και υλοποιείται ένας συστηματικός τρόπος κατασκευής της βάσης διασυλλαβών για την σύνθεση των ελληνικών λέξεων. (EN)

text

α) Δίκτυα Υπολογιστών και Ψηφιακές Επικοινωνίες, β) Μηχανική Οραση και Ρομποτική

Πανεπιστήμιο Κρήτης (EL)
University of Crete (EN)

1996-11-01
1997-06-2




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.