Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/259365
Type: DISSERTAÇÃO
Degree Level: Mestrado
Title: Sistema de conversão texto-fala para a lingua portuguesa utilizando a abordagem de sintese por regras
Author: Gomes, Leandro de Campos Teixeira
Advisor: Chiquito, Jose Geraldo, 1951-
Abstract: Resumo: Neste trabalho encontra-se descrito o sistema de conversão texto-fala para o português do Brasil desenvolvido no Laboratório de Processamento de Sinais da Faculdade de Engenharia Elétrica e de Computação da Unicamp. O sistema recebe como entrada um texto genérico em português e produz em sua saída o sinal de fala correspondente. O processo de conversão texto-fala divide-se em três etapas básicas, cada uma englobando vários módulos: Processamento de texto: pré-processamento, classificação gramatical, divisão silábica e transcrição ortográfico-fonética. Processamento prosódico: determinação de fronteiras prosódicas, geração de contornos de entonação e geração de durações de segmentos. Processamento de sinal: síntese do sinal de fala utilizando o sintetizador de formantes de Klatt. Os módulos de processamento prosódico empregam dados de duração e entonação extraídos de elocuções naturais, ajustando-os às particularidades do texto de entrada com base em informações provenientes do classificador gramatical. A abordagem de síntese por regras é utilizada para a geração dos parâmetros de controle do sintetizador. Uma linguagem e um compilador específicos foram criados para a descrição das regras de síntese. Embora não tenham sido realizadas avaliações formais da qualidade do sistema, testes informais indicaram um bom desempenho geral em termos de inteligibilidade e naturalidade

Abstract: This work contains a description of the text-to-speech conversion system for the Portuguese of Brazil developed at the Signal Processing Laboratory of the Electrical and Computer Engineering School of Unicamp. The system receives as input a generic text in Portuguese and produces as output the corresponding speech signal. The text-to-speech conversion process is divided into three basic steps, each one including several modules: Text processing: preprocessing, grammatical classification, syllabic division and orthographic-phonetic transcription. Prosodic processing: determination of prosodic boundaries, generation of intonation patterns and generation of segmental durations. Signal processing: synthesis of the speech signal using the Klatt formant synthesizer. The prosodic processing modules use duration and intonation data extracted from natural utterances, adjusting them to the particularities of the input text on the basis of information provided by the grammatical classifier. The synthesis-by-rule approach is used for generating the synthesizer control parameters. A specific language and a compiler have been created for the description of the synthesis rules. A1thoughformal evaluations of the system quality have not been made, informal tests have indicated a good general performance in terms of intelligibility and naturalness
Subject: Síntese da voz
Sistemas de processamento da fala
Language: Português
Editor: [s.n.]
Date Issue: 1998
Appears in Collections:FEEC - Tese e Dissertação

Files in This Item:
File SizeFormat 
Gomes_LeandrodeCamposTeixeira_M.pdf7.48 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.