Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/312725
Type: DISSERTAÇÃO
Degree Level: Mestrado
Title: Aplicação de protocolos e métodos em bioinformática para análise de sequenciamento de exomas humanos = Application of bioinformatics protocols and methods for human exome sequencing analysis
Title Alternative: Application of bioinformatics protocols and methods for human exome sequencing analysis
Author: Borges, Murilo Guimarães, 1989-
Advisor: Lopes-Cendes, Íscia Teresinha, 1964-
Cendes, Iscia Teresinha Lopes, 1964-
Abstract: Resumo: Os avanços técnicos em sequenciamento alcançados em menos de uma década, atrelados ao desenvolvimento e barateamento do sequenciamento de alto desempenho, oferecem-nos a possibilidade de aplicação dessas tecnologias na medicina genômica. Nesse contexto, surge o sequenciamento do exoma humano, constituído das regiões codificantes do genoma, menor que 2% de sua totalidade. O sequenciamento do exoma (WES) se estabelece hoje como uma ferramenta custo-efetiva com a finalidade de identificar variantes de sequência relacionadas a várias doenças humanas. A análise através da bioinformática é essencial para lidar com o alto volume de dados gerados e realizar a ligação entre o experimento biológico e os dados obtidos. Objetivo: Aplicar e avaliar protocolos e aplicações disponíveis na análise dos dados gerados pelo sequenciamento de exomas humanos, bem como aplicar e aperfeiçoar protocolos e aplicações disponíveis para predizer variantes como potencialmente patológicas a partir de dados gerados pelo sequenciamento de exomas humanos. Materiais e métodos: Foram utilizadas as seguintes ferramentas: FastQC, Rqc, BWA, Picard, GATK e VEP. Estas foram então aplicadas às sequências do exoma humano possibilitando a identificação de variações nos perfis de qualidade das sequências, realinhamento local ao redor de inserções e deleções, recalibração da qualidade e posterior chamada das variantes potencialmente envolvidas nos fenótipos em estudo. No intuito de avaliar se a cobertura no exoma sofre variações mediante diferenças técnicas e étnicas, selecionamos amostras do Projeto 1000 Genomas. Resultados: A aplicação de nosso protocolo em 27 amostras WES resultou em gráficos de controle de qualidade pré e pós-alinhamento, que nos permitiram avaliar de modo global os perfis de qualidade destas sequências; realinhamento ao redor de inserções e deleções que ocorreu em mais de 15% da definição do exoma, realinhando mais de 79% das sequências; recalibração da qualidade que nos permitiu minimizar sua variação por ciclo da reação. Das sequências empregadas, 72% foram pareadas ao genoma, contudo 46% se estendem para fora da definição do exoma, com uma cobertura média de 59x para o exoma estendido e 66x para o exoma restrito. Temos que a cobertura para WES possui uma tendência a variar de acordo com a metodologia de captura empregada e ao grupo étnico de onde as amostras foram obtidas. Conclusão: A aplicação de um workflow para interrogação de variantes que considera a qualidade das sequências fornecidas pelo sequenciador, o alinhamento contra o genoma, realinhamento ao redor de regiões sabidamente conhecidas como portadoras de variações, recalibração da qualidade e anotação permitiu identificar variantes de sequência. Além disso, através da cobertura obtida pelo sequenciamento do exoma foi possível perceber diferenças técnicas e populacionais, refletindo que a complexidade do genoma pode interferir na reação de captura das sequências, influenciando na efetividade da técnica empregada

Abstract: The technical advances in sequencing made in less than a decade associated with the development and low costs of high throughput sequencing techniques allow their application in genomic medicine. Therefore, Whole Exome Sequencing (WES), which corresponds to less than 2% of the entire genome, emerges as a cost-effective tool that aims to identify variants related to human diseases. Bioinformatics is fundamental to process the big volume of data and link the obtained results with the biology. Objective: We aim to apply and evaluate protocols and applications designed for WES data analysis on human subjects. We also intend to apply and enhance protocols and applications designed to predict variants as potentially pathological from WES data. Materials and Methods: We used the following tools: FastQC, Rqc, BWA, Picard, GATK e VEP. We applied them to exome data, determining variation in quality profiles, local realignment, quality recalibration and variant calls. We also evaluated whether or not technical and population differences affect the depth profiles of samples from the 1000 Genomes Project. Results: We applied our protocol on 27 samples, resulting in pre and post-alignment quality control charts. Local realignment took place at more than 15% of the exome definition, extending to more than 79% of sequences. Quality recalibration minimized per cycle variation. In total, 72% of the sequences were paired against the genome, nevertheless 46% extended off-target. The mean coverage was 59X for the exome. We also detected that depth tends to vary based on technical and population differences between samples. Conclusion: We applied a variant-calling workflow that accounts for sequence quality, the alignment against the genome, local realignment, quality recalibration and annotation. In addition, we concluded that depth depends on technical and population differences, showing that genomic complexity may interfere with the capturing phase, affecting downstream analyses
Subject: Exoma
Genomas
Biologia computacional
Editor: [s.n.]
Date Issue: 2015
Appears in Collections:FCM - Tese e Dissertação

Files in This Item:
File SizeFormat 
Borges_MuriloGuimaraes_M.pdf7.97 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.