Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/317153
Type: TESE DIGITAL
Degree Level: Doutorado
Title: Detecção de variações genômicas em bovinos da raça nelore usando dados de genotipagem e ressequenciamento = Detection of genomic variations in nelore-breed cattle using genotyping and resequenced data
Title Alternative: Detection of genomic variations in nelore-breed cattle using genotyping and resequenced data
Author: Silva, Joaquim Manoel, 1980-
Advisor: Yamagishi, Michel Eduardo Beleza
Abstract: Resumo: Os grandes avanços tecnológicos têm permitido o uso da genotipagem e do ressequenciamento para o estudo de variações genômicas que compreendem polimorfismos de base única (Single Nucleotide Polimorphism - SNP), pequenas inserções ou deleções, variações no número de cópias de alelos no genoma (Copy Number Variation - CNV) e uma gama de variantes estruturais. Esses avanços permitem uma análise completa do genoma com boa resolução e um custo cada vez mais baixo para ambas as tecnologias. O presente trabalho tem como objetivo detectar variações genômicas em bovinos da raça Nelore usando dados de genotipagem e ressequenciamento. Utilizamos dados genotípicos de 1.709 animais machos da raça Nelore genotipados com um chip de alta densidade com 777.962 marcadores SNPs e oito animais fundadores dessa população foram genotipados e ressequenciados com cobertura mínima de 20X. Inicialmente, usamos os Missing Genotypes, marcadores que falham em toda a população, para avaliar se eles contêm informações biológicas relevantes. Investigamos 3.200 SNPs que falharam consistentemente na população. Descobrimos que existe um total de 3.300 novos SNPs em Nelore. A anotação gênica mostrou que 31% desses novos SNPs estão em regiões gênicas e esses genes podem ser de interesse para os programas de melhoramento de gado de acordo com a literatura especializada. Sugerimos que a metodologia dos Missing Genotypes pode ser aplicada em saúde humana como possíveis marcadores para doenças genéticas hereditárias, doenças raras e doenças provenientes de mutações somáticas como o câncer. Além disso, o estudo de CNV (Copy Number Variation) permitiu o desenvolvimento de um novo algoritmo para agrupar CNV provenientes de dados de genotipagem e/ou ressequenciamento em CNV Region (CNVR). O algoritmo foi implementado em um web server Java-Merging Copy Number Variants (JM-CNV). Esse possui interface amigável, é de livre acesso e, parametrizável de modo que outros pesquisadores possam adaptá-lo às suas necessidades. Além disso, o arquivo de saída produzido pode ser facimente carregado no Genome Browser, o que facilita a visualização e o processo de curadoria manual. Comparamos o JM-CNV com outros dois softwares, o HD-CNV e o CNVRuler, com o mesmo propósito descrito acima. O JM-CNV se mostrou mais rápido e mais eficiente em resolver o agrupamento de CNVR em regiões complexas. Para a detecção de CNVs em Nelore usamos o software PennCNV para os dados de genotipagem e o software LUMPY para dados de ressequenciamento. Identificamos 68.007 regiões candidatas à CNVs nos 29 cromossomos autossomos, as quais foram agrupadas em 7.319 regiões de CNVs (CNVR) pelo JM-CNV. Usando o software LUMPY e os oito animais ressequenciados, detectamos 13.122 CNVs, as quais foram agrupadas em 3.648 regiões de CNVs (CNVR) pelo JM-CNV. Os dados de ressequenciamento nos permitiu validar 909 CNVs detectadas na genotipagem e outras 111 foram confirmadas fazendo uso da literatura, perfazendo um total de 1.020 CNVs validadas, que possuem diversos genes e QTLs anotados. O nosso estudo enriquece o mapa de variações genômicas do genoma bovino, em especial para a raça Nelore e fornece uma série de informações que podem subsidiar futuras pesquisas de associação entre CNVs e caraterísticas de interesse dos programas de melhoramento bovino

Abstract: Major technological advances have allowed for the use of genotyping and resequencing for the study of genomic variations, which include single-nucleotide polymorphisms (SNPs), small insertions or deletions, variations in the number of copies of alleles in the genome (otherwise known as copy number variations, or CNVs), and a range of structural variants. These advances have enabled complete genome analysis with good results at progressively lower costs. The present study seeks to detect genomic variations in Nelore cattle using genotyping and resequencing data. We used genotyping data from 1,709 Nelore bulls genotyped with a high-density chip with 777,962 SNP markers. A set of eight Nelore bulls representing historical sires were genotyped and resequenced with an average depth coverage of 20X. First, we determined whether the missing genotypes, or markers that fail in the entire population, contained relevant biological information. We investigated 3,200 SNPs that failed consistently in the population. We discovered that there are a total of 3,300 new SNPs in Nelore cattle. According to the literature on genomic annotation, 31% of these new SNPs are in genetic regions. These genes may be of interest to cattle improvement programs. We suggest applying the missing genotypes methodology to human health as a way to determine possible markers for rare diseases, hereditary genetic diseases and diseases caused by somatic mutations, such as cancer. The CNV study also enabled the development of a new algorithm for grouping together CNVs from genotyping and/or resequencing data from the CNV region (CNVR). The algorithm was implemented in a Java-Merging Copy Number Variant web server (JM-CNV). It possesses a user-friendly, open source, and configurable interface, meaning other researchers can adapt it to their needs. Its output file can be loaded into Genome Browser. We compared JM-CNV to two other programs ¿ HD-CNV and CNVRuler ¿ with the same objectives. JM-CNV was found to be faster and more efficient in resolving CNVR grouping in complex regions. To detect CNVs in Nelore cattle, we used the PennCNV software for the genotyping data and the LUMPY software for the resequencing data. We identified 68,007 CNV candidate regions in the 29 autosomal chromosomes, which were then grouped into 7,319 CNVRs using JM-CNV. Using the LUMPY software and the eight resequenced animals, we detected 13,122 CNVs, which were then grouped into 3,648 CNVRs using JM-CNV. Using the resequenced data, we were able to confirm 909 CNVs detected in the genotyping data and another 111 using the literature, for a total of 1,020 confirmed CNVs possessing many different genes and annotated QTLs. This study enriches the map of CNVs within the bovine genome, particularly the Nelore breed, and supplies important information that may support future studies on the association between CNVs and traits of interest in genetic improvement studies on cattle
Subject: Marcadores moleculares
Sequenciamento de nucleotídeos em larga escala
Variações do número de cópias de DNA
Bovino de corte
Genótipo
Software
Editor: [s.n.]
Citation: SILVA, Joaquim Manoel. Detecção de variações genômicas em bovinos da raça nelore usando dados de genotipagem e ressequenciamento = Detection of genomic variations in nelore-breed cattle using genotyping and resequenced data. 2015. 1 recurso online ( 107 p.). Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Biologia, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/317153>. Acesso em: 28 ago. 2018.
Date Issue: 2015
Appears in Collections:IB - Tese e Dissertação

Files in This Item:
File SizeFormat 
Silva_JoaquimManoel_D.pdf2.7 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.