Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/332459
Type: DISSERTAÇÃO DIGITAL
Degree Level: Mestrado
Title: Aplicação de treinamento multi-condição para aumentar o desempenho do IWR em ambientes reverberantes
Title Alternative: Using multi-condition training to increasing isolated word recognition performance in reverberant environments
Author: Ferreira, Fernanda de Souza, 1991-
Advisor: Tavares, Tiago Fernandes, 1984-
Abstract: Resumo: O sistema de Reconhecimento de Fala de Palavras Isoladas (RFPI) pode ser utilizado em diferentes aplicações baseadas em comandos, tais como: casas inteligentes, dispositivos de controle automotivos e controles de dispositivos eletrônicos em geral. Essas aplicações geralmente são utilizadas em ambientes reverberantes. A reverberação causa distorção espectral, prejudicando o desempenho do sistema RFPI. Nós sugerimos um método de treinamento multi-condição que usa tanto áudio reverberante quanto não reverberante para melhorar sua capacidade de generalização. O áudio reverberante é obtido pela aplicação de efeitos ao som digital. Os resultados mostraram maior robustez à reverberação em diversas condições. Portanto, o método proposto apresentou uma importante contribuição para aplicações com controles de voz em ambientes reverberantes

Abstract: Isolated Word Recognition (IWR) can be used in different applications based in control, such as smart home, automotive device control and electronic device controls in general. These applications often are used in reverberant environments. Reverberation causes spectral distortion, harming IWR performance. We propose a multi-condition training method that uses both reverberant and non-reverberant audio to improve its generalization capabilities. Reverberant audio is obtained by applying digital sound effects. Results show increased reverberation robustness in various conditions. Therefore, the proposed method posed an important contribution to voice control applications in reverberant environments
Subject: Reconhecimento automático da voz
Sistemas de reconhecimento de padrões
Language: Português
Editor: [s.n.]
Date Issue: 2018
Appears in Collections:FEEC - Tese e Dissertação

Files in This Item:
File SizeFormat 
Ferreira_FernandaDeSouza_M.pdf1.62 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.