Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/259521
Type: TESE
Title: Redução de dimensionalidade usando Isomap aplicada ao áudio espacial
Title Alternative: Dimensionality reduction using Isomap applied to spatial audio
Author: Grijalva Arévalo, Felipe Leonel, 1984-
Advisor: Martini, Luiz César, 1952-
Abstract: Resumo: Conforme as aplicações de realidade aumentada tornam-se mais relevantes, há um crescente esforço na pesquisa do áudio espacial. O termo áudio espacial refere-se ao conjunto de técnicas onde a anatomia de uma pessoa (i.e. o pavilhão da orelha, a cabeça e o torso) é modelada por meio de filtros digitais. Ao filtrar uma fonte de áudio através desses filtros, o ouvinte é capaz de perceber um som como se ele fosse reproduzido em um local específico no espaço. No domínio da frequência, esses filtros são conhecidos como Funções de Transferência Relativas à Cabeça (Head-Related Transfer Functions, HRTF). Nesta dissertação, estabelecem-se os princípios básicos do áudio espacial, fornecendo uma analise das características espectrais das HRTFs. Além disso, como essas características espectrais diferem de uma pessoa para outra, propõe-se um novo método baseado em antropometria para personalizar HRTFs no plano horizontal. O método usa o Isomap, redes neurais artificias e um procedimento de reconstrução baseado na vizinhança. Assim, modificou-se a construção do grafo do Isomap para ressaltar a individualidade das HRTFs e efetuar uma redução de dimensionalidade não linear das HRTFs. Em seguida, utilizou-se uma rede neural artificial para modelar as relações não lineares entre as características antropométricas e as HRTFs de baixa dimensionalidade. E finalmente, usou-se uma abordagem de reconstrução com base na vizinhança para reconstruir a HRTF a partir do seu equivalente de baixa dimensionalidade. As simulações mostram que a abordagem proposta tem um desempenho melhor do que o PCA (Principal Component Analysis, Analise de Componentes Principais) e confirmam que o Isomap é capaz de descobrir as relações não lineares subjacentes da percepção auditiva

Abstract: As auditory augmented reality applications become more important, there is increasing effort in spatial audio research. The term spatial audio refers to techniques where a person's anatomy (i.e. the pinnae, head and torso) is modeled as digital filters. By filtering a sound source with these filters, a listener is capable of perceiving a sound as though it were reproduced at a specific spatial location. In the frequency domain, these filters are known as Head-Related Transfer Functions (HRTFs). This thesis states the basic principles of spatial audio and provides an analysis of the spectral characteristics of HRTFs. Moreover, since these spectral features differ among individuals, we introduce a new anthropometric-based method for customizing of HRTFs in the horizontal plane. The method uses Isomap, artificial neural networks (ANN), and a neighborhood-based reconstruction procedure. We first modify Isomap's graph construction step to emphasize the individuality of HRTFs and perform a customized nonlinear dimensionality reduction of the HTRFs. We then use an ANN to model the nonlinear relationship between anthropometric features and our low-dimensional HRTFs. Finally, we use a neighborhood-based reconstruction approach to reconstruct the HRTF from the estimated low-dimensional version. Simulations show that our approach performs better than PCA (Principal Component Analysis) and confirm that Isomap is capable of discovering the underlying nonlinear relationships of sound perception
Subject: Percepção auditiva
Som
Editor: [s.n.]
Date Issue: 2014
Appears in Collections:FEEC - Dissertação e Tese

Files in This Item:
File SizeFormat 
GrijalvaArevalo_FelipeLeonel_M.pdf1.68 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.