Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/307181
Type: TESE
Title: Árvore de regressão para dados censurados e correlacionados
Title Alternative: Regression tree for censored and correlated data
Author: Argenton, Juliana Luz Passos, 1984-
Advisor: Pinheiro, Hildete Prisco, 1966-
Abstract: Resumo: O objetivo deste trabalho é apresentar uma metodologia de árvore de regressão para dados censurados e correlacionados. O conjunto de dados analisado foi obtido a partir de uma pesquisa realizada entre Dezembro de 2005 e Janeiro de 2006, que entrevistou 119 famílias (1712 indivíduos) que vivem no pequeno vilarejo de Baependi, no Estado de Minas Gerais. São apresentadas duas metodologias com base no modelo de riscos proporcionais, a primeira desconsidera a possível correlação existente entre os indivíduos de uma mesma família e usa a primeira iteração da estimativa da verossimilhança completa nas divisões dos nós. Na segunda metodologia apresentada, a correlação entre os indivíduos de uma mesma família é incorporada no modelo de riscos proporcionais através de uma variável de fragilidade com distribuição Gama, neste caso o valor da estatística Escore é usado para escolher a melhor divisão dos nós. O objetivo da análise é avaliar as variáveis que aumentam o risco de apresentar hipertensão, diabetes tipo II e colesterol alto, que são os três principais fatores que aumentam o risco de doenças no coração. As variáveis respostas são as idades de diagnóstico desses fatores de risco. A censura é definida de acordo com a observação da idade do indivíduo no momento do diagnóstico da doença e a idade do indivíduo no momento da pesquisa. Desta forma, uma idade de diagnóstico maior que a idade no momento da pesquisa caracteriza a censura.

Abstract: The objective of this work is to present methods of regression trees for censored and correlated data. The dataset analyzed was obtained from a survey, in which 119 families (1712 individuals) living in Baependi village, in the Brazilian state of Minas Gerais, were interviewed. Two methodologies based on the proportional hazard model are presented. The first disregards the possible correlation among the individuals of the same family, using the first step of a full likelihood estimation procedure for splitting nodes. In the second methodology, the correlation among the individuals of the same family is incorporated in the proportional hazard model through a frailty variable with Gamma distribution. In this case, the value of the Score statistic is used for choosing the best splitting node. The main purpose of the analysis is to evaluate the variables that increase the risk of hypertension, type II diabetes and high cholesterol, which are the top three main factors that increase the risk of heart conditions. The response variables are the age-of-onset of these risk factors. Censoring is defined by observing the individual's age-of-onset at the moment of diagnosis and also at the moment of the survey. This way, an age-of-onset higher than the age at the moment of the survey indicates censoring.
Subject: Árvores de decisão
Análise de sobrevivência (Biometria)
Correlação (Estatística)
Language: Português
Editor: [s.n.]
Date Issue: 2013
Appears in Collections:IMECC - Dissertação e Tese

Files in This Item:
File SizeFormat 
Argenton_JulianaLuzPassos_M.pdf2.04 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.