Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/304990
Type: TESE DIGITAL
Title: Sistemas de verificação de locutor baseados em i-vectors = Speaker verification systems based on i-vectors
Title Alternative: Speaker verification systems based on i-vectors
Author: Souza, Cristian Jesus Silva de Souza, 1990-
Advisor: Lee, Luan Ling, 1956-
Abstract: Resumo: A extração de parâmetros é uma das etapas fundamentais envolvidas em verificação de locutor. A correta estimação dos vetores de parâmetros é fundamental para a realização das etapas de modelamento e classificação. Os coeficientes mel-cepstrais MFCCs são os parâmetros mais utilizados em reconhecimento de locutor, entretanto o sinal de fala pode carregar outros tipos de informação. Este trabalho avalia a fusão do parâmetro VVGP (Variable Variance Gaussian Parameter) baseado na teoria multifractal, com os parâmetros MFCCs. Também comparamos o processo de modelamento tradicional de locutor representado por uma Mistura de Gaussianas (GMMs) com um outro mais atual baseado em um único vetor de baixa dimensão denominado i-vector. Os resultados experimentais, obtidos no presente trabalho demonstram a introdução adicional de informação fornecida pelo parâmetro VVGP em sistemas de verificação baseados em GMMs e i-vectors

Abstract: Feature extraction is an important step in an automatic speaker recognition system. Since feature extraction is the first step in the chain, the quality of the subsequent steps (modeling and classification) strongly depends on it. The mel-frequency cepstral coefficient (MFCC) front-end is the most used in speaker recognition systems, but the speech signal carry different kinds of information. In this dissertation, we study the performance of the Variable Variance Gaussian Parameter) (VVGP) based on multifractal theory combined with the MFCCs. The most popular approaches in speaker verification are those based on Gaussian Mixture Models, however a recent advance in speaker verification is to present utterances using a single vector, a so called i-vector. Experimental results indicate that the VVGP feature is complementary to MFCCs and can improve recognition accuracy in both GMMs and i-vector systems
Subject: Sistemas de processamento da fala
Distribuição gaussiana
Biometria
Editor: [s.n.]
Date Issue: 2015
Appears in Collections:FEEC - Tese e Dissertação

Files in This Item:
File SizeFormat 
Souza_CristianJesusSilvadeSouza_M.pdf1.02 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.