HNM-based DSP (Digital Signal Processing) module implementation of a TTS system

HNM-based DSP (Digital Signal Processing) module implementation of a TTS system

URI: https://www.openarchives.gr/aggregator-openarchives/edm/nemertes/000009-10889_159
RDF/XML JSON-LD

Το τεκμήριο παρέχεται από τον φορέα :
Πανεπιστήμιο Πατρών

Αποθετήριο :
Νημερτής

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου^*

Τίτλος

Υλοποίηση βαθμίδας ΨΕΣ (Ψηφιακής Επεξεργασίας Σήματος) συστήματος σύνθεσης ομιλίας με βάση τον αλγόριθμο ΗΝΜ. (EN)

HNM-based DSP (Digital Signal Processing) module implementation of a TTS system (EN)

Δημιουργός

Βασιλόπουλος, Ιωάννης

Συντελεστής

Vasilopoulos, Ioannis (EN)

Νίκος Φακωτάκης

Φακωτάκης, Νίκος

Στουραίτης, Αθανάσιος

Μουρτζόπουλος, Ιωάννης

Ημερομηνία έκδοσης

2005-02-27

2007-05-16T11:27:32Z

Χρονολογία

2005 (EL)

Περιγραφή

A TTS (Text-To-Speech) System is used to convert any given text to its corresponding speech with natural characteristics. A TTS consists of two modules, the Natural Language Processing (NLP) module and the Digital Signal Processing (DSP) module. The NLP module analyses the input text and supplies the DSP module with the appropriate phonemes and prosodic modifications, with concern to pitch, duration and volume of each phoneme. Then the DSP module synthesizes speech with the target prosody, using speech analysis-synthesis algorithms such as HNM. HNM (Harmonic plus Noise Model) algorithm models speech signal as the sum two parts, the harmonic part and the noise part. Speech analysis and speech synthesis with or without modifications, is achieved using the harmonic and the noise part (EN)

Ένα TTS (Τext-To-Speech) σύστημα μετατρέπει ένα οποιοδήποτε κείμενο στην αντιστοιχούσα ομιλία, η οποία έχει φυσικά χαρακτηριστικά. Το ΤΤS αποτελείται από δύο βαθμίδες, τη βαθμίδα Επεξεργασίας Φυσικής Γλώσσας (ΕΦΓ) και τη βαθμίδα Ψηφιακής Επεξεργασίας Σήματος (ΨΕΣ). Η βαθμίδα ΕΦΓ είναι υπεύθυνη για την σωστή ανάλυση του κειμένου εισόδου σε φωνήματα και το καθορισμό των επιθυμητών προσωδιακών χαρακτηριστικών, όπως το pitch, η διάρκεια και η ένταση του κάθε φωνήματος. Η βαθμίδα ΨΕΣ αναλαμβάνει να συνθέσει την ομιλία με τα επιθυμητά προσωδιακά χαρακτηρίστηκα, τα οποία έδωσε η βαθμίδα ΕΦΓ. Ένας τρόπος για να επιτευχθεί αυτό είναι με χρήση αλγορίθμων ανάλυσης και σύνθεσης ομιλίας, όπως ο αλγόριθμος HNM (Harmonic plus Noise Model).Ο ΗΝΜ μοντελοποιεί το σήμα ομιλίας ως άθροισμα δύο τμημάτων, ενός τμήματος με αρμονικά χαρακτηριστικά και ενός τμήματος με χαρακτηριστικά θορύβου. Χρησιμοποιώντας αυτό το μοντέλο γίνεται η ανάλυση και η σύνθεση του σήματος ομιλίας με ή χωρίς προσωδιακές μεταβολές.

Επιστημονικό πεδίο

Φυσικές Επιστήμες
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική (EL)

Θέμα

621.382 23

TTS (EN)

Text To Speech (EN)

Speech analysis (EN)

HNM (EN)

Harmonic plus Noise Model (EN)

Speech synthesis (EN)

Ανάλυση ομιλίας

Σύνθεση ομιλίας

Σχολή/Τμήμα/Ινστιτούτο

Πανεπιστήμιο Πατρών ▶ Πολυτεχνική Σχολή
Τμήμα Μηχανικών Η/Υ & Πληροφορικής

Πάροχος

Πανεπιστήμιο Πατρών

Αποθετήριο / συλλογή

Νημερτής

Επιμέρους συλλογή

Μεταπτυχιακές Εργασίες

Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΜΔΕ)

1. Διατριβές & Εργασίες | Theses & Dissertations

*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.

HNM-based DSP (Digital Signal Processing) module implementation of a TTS system

Βοηθείστε μας να κάνουμε καλύτερο το OpenArchives.gr.