Avaliação de algoritmos promotores de esparsidade para localização de fontes com arranjo esférico de microfones [recurso eletrônico]
Fernanda Caldas Correia
DISSERTAÇÃO
Português
T/UNICAMP C817a
[Evaluation of sparsity-promoting algorithms for sound source localization with spherical array of microphones]
Campinas, SP : [s.n.], 2021.
1 recurso online (65 p.) : il., digital, arquivo PDF.
Orientador: Bruno Sanches Masiero
Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação
Resumo: Ao realizar o processamento do áudio espacial de cenas sonoras, costuma ser necessário detectar primeiro as fontes sonoras presentes na cena, o que é comumente feito com o auxílio de um arranjo de microfones e um algoritmo detector de direção de chegada (DOA). Caso o sistema deva analisar o...
Ver mais
Resumo: Ao realizar o processamento do áudio espacial de cenas sonoras, costuma ser necessário detectar primeiro as fontes sonoras presentes na cena, o que é comumente feito com o auxílio de um arranjo de microfones e um algoritmo detector de direção de chegada (DOA). Caso o sistema deva analisar o som vindo de todas as direções possíveis, é comum o uso de um arranjo esférico de microfones. Algoritmos clássicos de estimação de DOA, como a decomposição em ondas planas e o beamforming esférico, apresentam baixa precisão para localizar fontes. Para melhorar a estimação da DOA, foi proposto o algoritmo compressive beamforming (CB). O CB aplica a regularização promotora de esparsidade ao problema de localização através do uso da minimização da norma L1 assumindo, portanto, que cenas sonoras são compostas por um pequeno número de fontes. Neste trabalho, é comparada a performance de três algoritmos de regularização promotora de esparsidade em um modelo de decomposição em ondas planas: a minimização da norma L1 via Disciplined Convex Program (DCP), o método Least Absolute Shrinkage and Selection Operator (LASSO) e o Orthogonal Matching Pursuit (OMP). Verifica-se que os três algoritmos foram capazes de determinar de forma acurada o número de fontes e suas direções para uma cena simulada, tanto com quanto sem ruído aditivo. A performance de todos algoritmos degradou quando aplicados a uma situação real com uma fonte gravada em ambiente anecoico. Neste caso, houve uma melhora da performance ao se combinar o LASSO para determinar o número de fontes com o OMP para refinar a estimativa da amplitude da onda
Ver menos
Abstract: When doing spatial audio processing of sound scenes it is often necessary to first detect the sound sources present in the scene, which is commonly done with the aid of a microphone array and a direction of arrival (DOA) estimation algorithm. If the system should be able to analyze sound...
Ver mais
Abstract: When doing spatial audio processing of sound scenes it is often necessary to first detect the sound sources present in the scene, which is commonly done with the aid of a microphone array and a direction of arrival (DOA) estimation algorithm. If the system should be able to analyze sound coming from all possible directions, then spherical microphone arrays are most commonly used. Classical DOA algorithms, such as plane-wave decomposition or spherical beamforming, suffer from low localization accuracy. In an attempt to improve DOA estimation, the compressive beamforming (CB) algorithm has been proposed. CB applies sparsity regularization to the localization problem through the use of L1-norm minimization, therefore taking into account the assumption that common sound scenes are usually composed of only a handful of sound sources. In this thesis, the performance of three sparsity regularization algorithms on a plane-wave decomposition model is compared: the $\ell_1$-norm minimization via Disciplined Convex Program (DCP), the Least Absolute Shrinkage and Selection Operator (LASSO) method and the Orthogonal Matching Pursuit (OMP). It is shown that the three algorithms were able to accurately estimate the number of sources and its directions for an artificial sound scene, both with and without noise. However, the performance was shown to deteriorated when applied at a practical situation with a sound source recorded in an anechoic chamber. In this case, there was an improvement with the combination of the LASSO to estimate the number of sound sources and the OMP to refine the wave amplitude
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Avaliação de algoritmos promotores de esparsidade para localização de fontes com arranjo esférico de microfones [recurso eletrônico]
Fernanda Caldas Correia
Avaliação de algoritmos promotores de esparsidade para localização de fontes com arranjo esférico de microfones [recurso eletrônico]
Fernanda Caldas Correia