Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/330609
Type: DISSERTAÇÃO DIGITAL
Degree Level: Mestrado
Title: Extração e modulação de descritores sonoros a partir da síntese aditiva fractal
Title Alternative: Audio feature extraction and manipulation based on fractal additive synthesis
Author: Roque, Thiago Rossi, 1988-
Advisor: Mendes, Rafael Santos, 1957-
Abstract: Resumo: Os recentes avanços da tecnologia da informação e da capacidade de processamento têm favorecido o desenvolvimentos de novas técnicas de processamento de sinais e extração de informações no âmbito da escuta e aprendizado por máquina. Este ambiente favoreceu o surgimento da ciência multidisciplinar conhecida por \textit{recuperação de informação musical} (MIR), que busca estudar e desenvolver técnicas de analise automática de sinais musicais. Uma das mais importantes ferramentas desenvolvidas pela MIR são os chamados \textit{descritores sonoros}, que são conjuntos de informações passíveis de serem extraídas automaticamente e com significados objetivos a respeito de determinadas características de sinais sonoros. Este trabalho visa o estudo da relação entre certos descritores sonoros e algumas características perceptuais relacionadas ao timbre de instrumentos musicais. Como suporte a esta análise, optou-se por utilizar uma técnica ainda pouco estudada chamada de síntese aditiva fractal (FAS), que possibilita codificar sinais sonoros de altura definida a partir de uma reduzida quantidade de parâmetros ao separar o conteúdo determinístico (que compreende as informações periódicas puras) e o conteúdo estocástico (relacionado a elementos da pseudo-periodicidade e do ruído presente). Diferentemente de técnicas tradicionais, a FAS não se fundamenta na transformada de Fourier, mas sim na transformada wavelet de banda harmônica, que tem como princípio a codificação das bandas laterais de cada harmônico como um processo de perfil 1/f, a partir da transformada wavelet. Por possibilitar uma análise de cada banda lateral de cada harmônico, a FAS fornece uma codificação intra-harmônico, garantindo um nível de detalhamento de sinais tonais, ou seja, de altura definida, não encontrado em técnicas tradicionais. Este trabalho tem como objetivo a implementação de um sistema fundamentado na FAS capaz de codificar sinais tonais musicais para a extração e manipulação de descritores sonoros a fim de estudar sua relação com características perceptuais. Ao longo deste trabalho foi desenvolvido um novo descritor focado na codificação da seção estocástica do som, o coeficiente de correlação de banda harmônica (CCBH)

Abstract: Recent advances in information technology and processing power of modern computers lead the development of new signal processing techniques and information extraction for machine listening and learning. This environment favoured the development of the multidisciplinary science called \textit{music information retrieval} (MIR), that aim the study and development of musical signals automatic analysis techniques. Some of the most important MIR tools are \textit{sound features}, that are information sets capable of been automatic extracted and with objective meaning on some perceptual aspects of sound signals. This research aims the study of the relation between sound features and perceptual aspects related with the timbre of musical instruments. As framework for this analysis, a still poorly studied technique called \textit{fractal additive synthesis} (FAS) has been chosen, capable of coding pitched sound signals by a small set of parameters, by splitting its content into a deterministic set (composed by its pure periodic information) and a stochastic set (related to its pseudo-periodicity and background noise). As a difference from traditional techniques, FAS is not based on Fourier transform, but on \textit{harmonic band wavelet transform}, which is based on the idea of coding each harmonic side-band as a $1/f$ process with the wavelet transform. By enabling an analysis of each harmonic side-band, FAS is capable of an intra-harmonic coding, ensuring a high level of detail for pitched sound signals not found in traditional techniques. This research has the development of a FAS based system capable of encoding pitched sound signals for extraction and manipulation of sound features as objective, in order to study its relation with perceptual attributes. Throughout this work a new sound feature was developed aiming the encode of the stochastic section of sound, the harmonic band correlation coefficient (CCBH)
Subject: Processamento digital de sinais
Descritores
Transformada wavelet
Dimensão fractal
Registros sonoros
Language: Português
Editor: [s.n.]
Citation: ROQUE, Thiago Rossi. Extração e modulação de descritores sonoros a partir da síntese aditiva fractal. 2017. 1 recurso online (110 p.). Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/330609>. Acesso em: 2 set. 2018.
Date Issue: 2017
Appears in Collections:FEEC - Tese e Dissertação

Files in This Item:
File SizeFormat 
Roque_ThiagoRossi_M.pdf6.78 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.