Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/316503
Type: TESE
Title: Análise do transcriptoma e de sequências genômicas de variedades comerciais de cana-de-açúcar = Transcriptome and genomic sequences analysis of commercial sugarcane varieties
Title Alternative: Transcriptome and genomic sequences analysis of commercial sugarcane varieties
Author: Cardoso-Silva, Cláudio Benício, 1982-
Advisor: Souza, Anete Pereira de, 1962-
Abstract: Resumo: A cana-de-açúcar é uma das espécies de maior importância econômica no mundo devido ao seu potencial bioenergético. No entanto, o seu alto nível de complexidade genética é um desafio para a aplicação de ferramentas moleculares no melhoramento. Os recentes avanços das tecnologias de sequenciamento e genotipagem indicam o potencial de aumentar o nosso entendimento sobre a genética e a biologia molecular desta espécie. As sequências genômicas e de transcriptomas são valiosa fonte de informação para o desenvolvimento de ferramentas moleculares que permitam a identificação de regiões no genoma que estejam relacionadas com características de interesse para o melhoramento. O uso das novas tecnologias de sequenciamento de alto desempenho tem grande potencial de impacto nestas pesquisas. A presente tese objetivou analisar o transcriptoma de seis variedades comerciais e dados genômico da variedade R570, com a finalidade de identificar genes potencialmente úteis para o desenvolvimento de marcadores moleculares. A partir do método RNA-Seq, foram geradas mais de 400 milhões de sequências, as quais permitiram obter um total de 72.269 transcritos representados por uma única isoforma montados com auxílio do programa Trinity. Estes transcritos foram alinhados com sequências de Viridiplantae, gramíneas, e exclusivamente contra proteínas de sorgo, arroz, milho e transcriptoma de cana-de-açúcar, depositados em banco de dados público. Esta análise permitiu identificar o conjunto de genes de cana-de-açúcar compartilhados com outras gramíneas, bem como levou à identificação de novos transcritos que não haviam sido catalogados para cana-de-açúcar, além de longos RNAs não codificantes. Os transcritos foram anotados no Cluster of Orthologous Groups (COG) e no Gene Ontology (GO), com posterior análise de enriquecimento dos termos GO, a partir da qual foram anotados os transcritos, possivelmente relacionados a genes que conferem características de importância agronômica. No transcriptoma foram identificados mais de 700 mil SNPs e aproximadamente cinco mil regiões microssatélites. Analisando um total de 32 Mbp de sequências genômicas da variedade R570 foram identificados 4.342 microssatélites, com frequência média de sete SSR/Kb. As sequências geradas e exploradas neste trabalho são valiosa fonte de informações para entender a arquitetura genética da cana-de-açúcar, principalmente para o desenvolvimento de marcadores moleculares, os quais podem ser utilizados no mapeamento genético

Abstract: The sugarcane is one of the most economically important species in the world, due to their energy potential. However, high level of genetic complexity has been a major challenge for the use of molecular tools applied to improvement of this crop. Recent advances in sequencing and genotyping technologies indicate the potential to increase our understanding of the genetics and molecular biology of this specie. The genomic and transcriptomic are valuable sources of information for the molecular tools development that allow identification of regions in the genome that are related to characteristics of interest for the improvement. The high-throughput sequencing technologies have great impact of this research. This thesis aimed to analyze the transcriptome of six commercial varieties and genomic sequencing from R570 variety, in order to identify genes potentially useful for the molecular markers development. From RNA-Seq method were generated over 400 million sequences, which allowed obtain a total of 72,268 transcripts representing a single isoform assembled by Trinity. These transcripts were aligned against Viridiplantae, grasses, and exclusively against sorghum, rice and maize proteins, and sugarcane transcriptome available in the public database. This analysis allowed identifying a set of shared genes with other grasses, new transcripts that had not yet been cataloged for sugarcane and long non-coding RNAs. The transcripts were also annotated using the COG (Cluster of Orthologous Groups) and GO (Gene Ontology) database, followed by enrichment analysis for GO terms, from which it was possible to identify genes that play roles, possibly related to traits of agronomic importance. In the transcriptome were identified over 700 thousands SNPs and five thousands microsatellites regions. In the genomic sequences from R570 variety, in a total of 32 Mbp were identified 4,342 microsatellites, with an average frequency of seven SSR / Kb. The sequences generated and explored in this work is a valuable source to understand the genetic architecture of the sugarcane, mainly for molecular markers development, which can be used in genetic mapping
Subject: Saccharum
Marcadores moleculares
RNA-seq
Genômica
Language: Multilíngua
Editor: [s.n.]
Date Issue: 2015
Appears in Collections:IB - Dissertação e Tese

Files in This Item:
File SizeFormat 
Cardoso-Silva_ClaudioBenicio_D.pdf32.04 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.