Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/261238
Full metadata record
DC FieldValueLanguage
dc.contributor.CRUESPUNIVERSIDADE ESTADUAL DE CAMPINASpt_BR
dc.identifier(Broch.)pt_BR
dc.descriptionOrientador: Fabio Violaropt_BR
dc.descriptionDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computaçãopt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.typeDISSERTAÇÃOpt_BR
dc.titleAdaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿pt_BR
dc.contributor.authorSousa, Livio Carvalhopt_BR
dc.contributor.advisorViolaro, Fabio, 1950-pt_BR
dc.contributor.institutionUniversidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computaçãopt_BR
dc.subjectTelecomunicaçõespt_BR
dc.subjectProcessamento de sinaispt_BR
dc.subjectSistemas de processamento da falapt_BR
dc.subjectReconhecimento automático da vozpt_BR
dc.subjectReconhecimento automatico da falapt_BR
dc.description.abstractResumo: Neste trabalho realizou-se o estudo da técnica via "eigenvoices"[13] [16][17][18] [30] [31]para adaptação de locutor em um sistema de reconhecimento de fala contínua usando o português do Brasil. Dentre as várias técnicas utilizadas para a adaptação de locutor, incluindo as clássicas MAP ("Maximum A Posteriori'') e MLLR ("Maximum Likelihood Linear Regression''), uma nova técnica, chamada "eigenvoice technique", foi proposta por Kuhn visando tornar mais rápido o processo de adaptação de locutor para aplicação em sistemas operando em tempo real. No início, estudos se concentraram nas aplicações com palavras isoladas, mas várias pesquisas estão sendo realizadas para a análise dessa técnica em fala contínua, como é o caso deste trabalho. A característica principal da técnica de adaptação via "eigenvoices" é a representação do novo locutor como uma combinação linear de parâmetros ("eigenvoices") obtidos a partir de modelos dependente de locutor previamente treinados. Dessa forma, o novo locutor é representado como um ponto dentro do espaço cujos eixos são formados pelos "eigenvoices". O algoritmo de máxima verossimilhança MLED ("Maximum Likelihood Eigen Decomposition'') foi usado para o cálculo dos coeficientes da combinação linear para a estimação dos parâmetros do novo locutor. Após a realização de testes com número variado de locuções de adaptação e de iterações do algoritmo, foi observado que: para um bom desempenho dos modelos adaptados, 3 a 5 iterações do algoritmo são necessárias; o mais importante não é o número de locuções de adaptação mas sim o seu conteúdo fonético. Em suma, o estudo revelou que a técnica se mostrou eficiente para a aplicação, porém mais pesquisas são necessárias na áreapt
dc.description.abstractAbstract: In this work a research was made in order to evaluate the use of the eigenvoice technique (13) (16) (17) (18) (30) (31) to speaker adaptation on a continuous speech recognition system. Amongst the severa! speaker adaptation techniques, like the classical MAP and MLLR, a new technique, called eigenvoice technique, was proposed by Kuhn for fast speaker adaptation in real time applications. Firstly, researches were made just on isolated words applications, and nowadays they are focused on continuous speech applications, like this work. The main feature of the eigenvoice technique is the representation of the new speaker by a linear combination of parameters (eigenvoices) extracted from speaker dependent models previously trained. The new speaker is represented by a point in a space whose axis are the eigenvoices. The Maximum Likelihood Eigen Decomposition (MLED) algorithm was used to calculate the combination coefficients in order to estimate the parameters of the new speaker. After tests varying the number of adaptation sentences and algorithm iterations, it was verified that: for a good adaptation performance, 3 to 5 algorithm iterations are necessary; the number of adaptation sentences is not very important, the more important is the adaptation sentences phonetic contento In conclusion, the eigenvoice technique showed to be efficient for the application on continuous speech, however more studies must be made in the areaen
dc.publisher[s.n.]pt_BR
dc.date.issued2004pt_BR
dc.identifier.citationSOUSA, Livio Carvalho. Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿. 2004. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/261238>. Acesso em: 3 ago. 2018.pt_BR
dc.description.degreelevelMestradopt_BR
dc.description.degreedisciplineTelecomunicações e Telemáticapt_BR
dc.description.degreenameMestre em Engenharia Elétricapt_BR
dc.contributor.committeepersonalnameYnoguti, Carlos Albertopt_BR
dc.contributor.committeepersonalnamePortugheis, Jaimept_BR
dc.contributor.committeepersonalnameMartins, José Antôniopt_BR
dc.date.defense2004-09-24T00:00:00Zpt_BR
dc.date.available2018-08-04T00:34:40Z-
dc.date.accessioned2018-08-04T00:34:40Z-
dc.description.provenanceMade available in DSpace on 2018-08-04T00:34:40Z (GMT). No. of bitstreams: 1 Sousa_LivioCarvalho_M.pdf: 871098 bytes, checksum: 153f38e7d25defc4147ff0417e22add1 (MD5) Previous issue date: 2004en
dc.identifier.urihttp://repositorio.unicamp.br/jspui/handle/REPOSIP/261238-
Appears in Collections:FEEC - Tese e Dissertação

Files in This Item:
File SizeFormat 
Sousa_LivioCarvalho_M.pdf850.68 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.