Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/305605
Type: TESE DIGITAL
Title: Medidas de áudio com fundamentação neurofisiológica aplicadas para a segmentação automática de músicas feitas de sons não redutíveis ao conceito de nota musical
Title Alternative: Neurophysiological based audio features applied to automatic segmentation of music made of sounds non-reducible to the concept of musical note
Author: Monteiro, Adriano Claro, 1984-
Advisor: Manzolli, Jônatas, 1961-
Junior, Adolfo Maia
Abstract: Resumo: Esta tese analisa a aplicação de um modelo de representação sonora de integração espectro-temporal, fundamentado em pesquisas neurofisiológicas do sistema auditivo humano, para a segmentação automática de registros musicais. A pesquisa aqui reportada enfoca o repertório de músicas em que a convenção de notas musicais (i.e. a nota como o elemento mínimo da construção musical) é substituída pelo uso de sons com características espectrais e temporais diversas. A representação do sinal acústico obtida através desse modelo foi usada como entrada para um algoritmo de segmentação musical, proveniente da área de Recuperação da Informação Musical (do inglês, Music Information Retrieval, MIR), que é baseado na identificação de intervalos temporais com alto grau de auto-similaridade. Para avaliarmos o desempenho do modelo auditivo neurofisiológico para a tarefa de segmentação musical comparamos seus resultados com a segmentação manual das partituras das músicas analisadas, bem como comparamos estatisticamente o resultado dessas análises com as obtidas através de outros modelos de representação espectral instantânea ou espectro-temporal encontrados na literatura de MIR. As músicas selecionadas para os experimentos analíticos foram Innermost Man do compositor russo Dmitri Kourliandski, e Pression, do compositor germânico Helmut Lachenmann. Nossos resultados mostram que o modelo de representação sonora espectro-temporal embasado em conhecimentos de neurofisiologia teve melhor desempenho para o procedimento de segmentação automática da forma musical do que os demais modelos de representação sonora avaliados. A Tese é dividida da seguinte maneira: o capítulo 1 apresenta o escopo do trabalho, nossos objetivos, pressupostos teóricos e terminologias adotadas. O capítulo 2 contém a revisão bibliográfica de áreas do conhecimento que interseccionam este trabalho, a saber: métodos de análise para músicas contendo sons com variedade de características espectro-temporais; metodologias de segmentação automática de música; uma breve revisão sobre a fisiologia do sistema auditivo humano focando em aspectos importantes para os modelos de computacionais utilizados; uma breve contextualização sobre as obras utilizadas nos experimentos analíticos e os respectivos compositores. O capítulo 3 descreve os métodos computacionais de análise de áudio empregados em nosso trabalho, e nosso design experimental. O capítulo 4 mostra a segmentação manual e automática das obras musicais selecionadas, bem como as avaliações estatísticas dos resultados do algoritmo de segmentação da forma musical em função dos modelos de representação sonora utilizados. No capítulo 5 discutimos os resultados e projeções para continuidade da pesquisa

Abstract: This thesis presents an analysis of the use of spectro-temporal representation of sounds, grounded on auditory neurophysiologic researches, to automatic segmentation of musical recordings. It focuses on the analysis of music in which the musical note concept (i.e the musical note as the minimum element of music construction) is replaced by sounds with a variety of spectral and temporal configurations. The sound representation yield by these models were used as input for a music segmentation algorithm, a standard method from the Music Information Retrieval (MIR) area, based on the identification of temporal intervals with high levels of self-similarity. To evaluate our results we compared them with manual segmentations of music scores, as well as analyzed statistics of this comparison against the ones obtained by segmentation process using other spectro-temporal or instantaneous spectral models. The musical works selected to our analytical experiments were: Innermost Man, by the Russian composer Dmitri Kourliandski, and Pression, by the German composer Helmut Lachenmann. Our results show that the spectro-temporal sound representation based on neurophysiological knowledge had a better performance for the task of automatic segmentation of musical form than the other sound representation models evaluated. This thesis is divided as follows: Chapter 1 presents our objectives, theoretical assumptions, and adopted terminology. Chapter 2 contains a bibliographical review of areas that intersect this work: analytical works of music containing sounds with diversity of spectro-temporal configurations; methods for automatic segmentation of musical form; a brief revision on the physiology of the human auditory system focusing on important aspects related to the computer models adopted; a brief contextualization on the works used in our experiments as well its related composers. Chapter 3 describes our computational methods for audio analysis, and our experimental design. Chapter 4 shows the manual and automatic segmentation of the selected works, as well the statistical evaluation of the results yield by the segmentation algorithm regarding the sound representation models applied. In Chapter 5 we discuss our results and projections to future works
Subject: Música - Séc. XX - Análise, apreciação
Música - Século XXI - Análise e apreciação
Neurociências e música
Percepção auditiva
Forma musical
Mineração de dados (Computação)
Som - Registro e reprodução
Editor: [s.n.]
Date Issue: 2016
Appears in Collections:IA - Tese e Dissertação

Files in This Item:
File SizeFormat 
Monteiro_AdrianoClaro_D.pdf24.2 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.