Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/306506
Type: TESE
Title: Analise não-parametrica de dados funcionais : uma aplicação a quimiometria
Title Alternative: Nonparametric functional data analysis applications to chemometrics
Author: Saraiva, Marley Apolinario
Advisor: Dias, Ronaldo, 1959-
Abstract: Resumo: Devido à grande evolução dos computadores tornou-se comum coletar dados de alta dimensão. A quimiometria, que é a aplicação de métodos estatísticos e matemáticos à dados de origem química, pode ser citada como exemplo, pois nestes casos os dados são espectros que geralmente são observados em vários comprimentos de onda. O problema de como combinar estes espectros de forma ótima com o objetivo de aproximar medidas de concentrações é um problema de calibração multivariada. Em geral, esta calibração é feita com técnicas de estatística multivariada, que por sua vez, apresentam sérias dificuldades em lidar com a alta dimensão dos dados. Nesta dissertação propomos um modelo que considere as características funcionais intrínsecas deste tipo de problema, uma vez que as técnicas de estatística multivariada não consideram tais características. Algumas das técnicas de estatística multivariada mais utilizadas são de regressão linear múltipla multivariada (MLR) e regressão por mínimos quadrados parciais (PLS). Estas técnicas resumem a informação da matriz de dados, seja por escolha de quem está modelando, seja por análise de componentes principais e isto pode ocasionar perda de informa ações importantes para as análises. Devido a estas dificuldades propomos um modelo que considera o dado como ele é, uma função, e não como um dado multivariado e propomos também um modelo funcional para a estrutura de covariância. Ambos os modelos propostos utilizam a análise de dados funcionais (ADF) e por isso não apresentam as dificuldades comuns dos métodos de estatística multivariada, uma vez que a alta dimensão dos dados não é tão restritiva quanto nas técnicas multivariadas.

Abstract: With the computer evolution, the high dimension data collection has become common. The chemometrics, which is the application of statistical and mathematical methods to the chemical data, it can be an example. In these cases the data are spectra that are usually observed in several wavelengths. The problem of how to combine these spectra optimally with the goal of bringing the measurement of concentrations is a multivariate calibration problem. In general, this calibration is done with multivariate statistical techniques but there are severe difficulties in dealing with high-dimensional data. In this dissertation we propose a model that considers the intrinsic functional characteristics of this kind of problem, since the multivariate statistics techniques do not consider such features. Some of useful multivariate statistical techniques are multivariate linear regression (MLR) and partial leas squares (PLS). These techniques summarize the information of the data matrix, either by choosing who is modeling or by principal component analysis and this can cause lost of important information for analysis. Because of these difficulties we propose a model that considers the data as it is, a function, not as a multivariate data and we also propose a working model for the covariance structure. Both proposed models using functional data analysis (ADF) and therefore do not have the common difficulties of the methods of multivariate statistics, since the high-dimensional data is not as restrictive as in multivariate analysis.
Subject: Spline, Teoria do
Estatística não paramétrica
Análise multivariada
Language: Português
Editor: [s.n.]
Date Issue: 2009
Appears in Collections:IMECC - Dissertação e Tese

Files in This Item:
File SizeFormat 
Saraiva_MarleyApolinario_M.pdf2.84 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.