Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/290036
Type: DISSERTAÇÃO
Degree Level: Mestrado
Title: Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos
Title Alternative: Bioinformatic parameters of genomic context as predictors of functional impact in point substitutions of human gene 5' UTR
Author: Urioste, Eduardo Arcanjo, 1989-
Advisor: Line, Sergio Roberto Peres, 1963-
Abstract: Resumo: Estima-se que cada indivíduo carregue cerca de 120 a 430 variantes raras em regiões UTRs (Abecasis et al, 2012). Apesar da tolerância a variação na região 5' UTR, a patofisiologia de várias doenças está ligada a mutações na mesma (Cazzola & Skoda, 2000; Reynolds, 2002; Chatterjee & Pal, 2009; Wethmar et al 2010), sendo necessário o entendimento a determinação dos mecanismos regulatórios. O objetivo deste trabalho é descobrir assinaturas genéticas encontradas no contexto genômico de mutações pontuais de região 5' UTR que permitam prever o impacto funcional de outras variações pontuais na mesma região. As mutações, causadora de doença, foram selecionadas do banco de dados do Human Gene Mutation Database (HGMD) (Stenson et al, 2008); e os polimorfismos, de impacto funcional desconhecido, foram obtidos no banco de dados NHLBI Grand Opportunity Exome Sequencing Project (ESP), sendo originados do trabalho de Tenessen et al (2012). No total foram utilizadas 235 mutações e 21.542 polimorfismos. Para as variações foram calculados parâmetros de variação da estabilidade da estrutura secundária do contexto das variações (??Gfolding), presença de sítios de ligação de fatores de transcrição (JASPAR), tipo de variação (transição/transversão, tipoV), distância do início da sequência codificante (DiSC), distância do início de transcrição (DiTr) e conservação filogenética por distância de Levenshtein do contexto (Lev). A estatística foi calculada pelos testes de Wilcoxon e Binomial. A partir destes foram gerados modelos de regressão logísticos analisados através de curva ROC. Os parâmetros ??Gfolding máximo, tipoV, DiSC, e Lev permitiram a distinção significativa (? = 0,05) entres os polimorfismos e as mutações permitindo modelos explicativos, mas incompletos (área da Curva ROC 0, 772). ??Gfolding max. indicou uma relação entre as mutações e entre estruturas secundárias mais estáveis geradas pelas mesmas. Os parâmetros Lev e tipoV sugerem a origem das mutações como resultantes de hotspots. O parâmetro DiSC indicou regiões com provável funcionalidade. Apesar de não ter sido possível estabelecer relação causal entre os parâmetros e o impacto funcional das variações, encontrou-se correlações importantes

Abstract: It is estimated that each individual carries about 120 to 430 rare variante in the UTR regions (Abecasis et al, 2012). Despite the increased tolerance towards variations in 5' UTR region, the patho-phisiology of several diseases is linked to its mutations (Cazzola & Skoda, 2000; Reynolds, 2002; Chatterjee & Pal, 2009; Wethmar et al 2010). Therefore it is necessary the understanding and the determination of the regulatory elements. The objective of this study is the discovery of genetic signatures found in the genomic context of disease causing point mutations in 5' UTR, thus allowing the prediction of the functional impact of other point variations in the same region. The disease causing mutations were selected from Human Gene Mutation Database (HGMD) (Stenson et al, 2008). The polymorphisms of unknown functional impact were obtained from the NHLBI Grand Opportunity Exome Sequencing Project (ESP), originated from the work of Tenessen et al (2012). A total of 235 mutations and 21,542 polymorphisms were used. For each variation, parameters related with the differences of the variation's context folding stability (??Gfolding), presence of transcription factor binding sites (JASPAR), type of variation (transition/transversion, tipoV), distance from coding sequence start (DiSC), distance from transcription start site (DiTr) and phylogenetic conservations by distance of Levenshtein from wild type to variant context (Lev). The statistical test was done by Wilcoxon and Binomial. Logistical regressions models were generated from the parameters and its performance was evaluated by a ROC curve. The parameters maximal ??Gfolding, tipoV, logarithm of DiSC and Lev allowed a significant distinction (? = 0,05) between the groups, generating models of reasonable explanation but incomplete (area under the ROC curve 0,772). Maximal ??Gfolding showed a relationship between mutations and stable secondary structures generated by them. Lev and tipoV suggested the origin of the mutation from hotspots. The DiSC parameter identified regions with possible functionality. While it was not possible to establish any clear causal relationship between the parameters and the functional impact of the variations, important correlations were found
Subject: Regiões 5' não traduzidas
Mutação
Curva ROC
Biologia computacional
Language: Português
Editor: [s.n.]
Citation: URIOSTE, Eduardo Arcanjo. Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos. 2013. 63 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Odontologia de Piracicaba, Piracicaba, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/290036>. Acesso em: 22 ago. 2018.
Date Issue: 2013
Appears in Collections:FOP - Tese e Dissertação

Files in This Item:
File SizeFormat 
Urioste_EduardoArcanjo_M.pdf1.24 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.