Identification of biological characteristics associated with RNA-binding proteins (RBPs) target sites [recurso eletrônico] = Identificação de características biológicas associadas a sítios-alvo de proteínas de ligação ao RNA (RBPs)
Felipe Eduardo Ciamponi
DISSERTAÇÃO
Inglês
T/UNICAMP C481i
[Identificação de características biológicas associadas a sítios-alvo de proteínas de ligação ao RNA (RBPs)]
Campinas, SP : [s.n.], 2018.
1 recurso online (85 p.) : il., digital, arquivo PDF.
Orientador: Katlin Brauer Massirer
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia
Resumo: Parte 1: Artigo ¿ BioFeatureFinder: Flexible, unbiased analysis of biological characteristics associated with genomic regions BioFeatureFinder (BFF) avalia regiões genômicas de interesse (incluindo exons alternativos, sítios de ligação de proteínas, elementos funcionais no gene/transcrito)...
Ver mais
Resumo: Parte 1: Artigo ¿ BioFeatureFinder: Flexible, unbiased analysis of biological characteristics associated with genomic regions BioFeatureFinder (BFF) avalia regiões genômicas de interesse (incluindo exons alternativos, sítios de ligação de proteínas, elementos funcionais no gene/transcrito) para identificar características biológicas distintas (conteúdo de nucleotídeos, conservação, k-mers, estrutura secundária, sítios de ligação de proteínas e outros). BFF usa um modelo fundamental flexível, combinando testes estatísticos clássicos com estratégias de aprendizado de máquina e "big data", utilizando de milhares de características para interpretar rótulos de categorias em conjuntos de intervalos genômicos ou escalas numéricas a partir de grafos. Nossos resultados mostram que o BFF proporciona uma plataforma confiável para analises de conjuntos de dados de larga-escala, sendo capaz de recuperar diversas características conhecidas da literatura para proteínas de ligação a RNA, bem como identificar novas associações para 112 conjuntos de dados de eCLIP-seq. BioFeatureFinder está disponível em: https://github.com/kbmlab/BioFeatureFinder/. Parte 2: Identificatificação de mRNAs-alvo e características dos sítios de ligação para a proteína de ligação ao RNA Caprin-1 usando eCLIP-seq Grânulos de stress são agregados de proteínas e RNAs encontrados no citoplasma das células, em geral produzidos em resposta uma forma de stress (ex. Hipóxia, infecções virais, privação de nutrientes e choques térmicos). No entanto, diversas doenças neurodegenerativas, como esclerose lateral amiotrófica e Alzheimer, já foram associadas com inclusões patogênicas desses agregados que geram consequências nocivas para a célula. Dentre as proteínas presentes no granulo de stress o complexo G3BP1-CAPRIN1-USP10 é essencial para a condensação do granulo e sua associação com subunidades ribossomais, sendo que a expressão ectópica de CAPRIN1 é suficiente para induzir a formação desses agregados. Apesar dos mecanismos moleculares associados aos grânulos não estarem completamente elucidados, as principais funções propostas para estas estruturas são: a proteção dos RNAs de situações danosas, degradação de mRNAs alvo, seleção da tradução de mRNAs de resposta a stress e reprogramação da expressão gênica (transcriptoma). Para caracterizar os mRNAs-alvo de Caprin-1 nos grânulos de stress, utilizamos da combinação de técnicas de CLIP-seq, RIP-seq e RNA-seq para determinar os sítios de ligação que Caprin-1 apresenta nos alvos, bem como quais classes funcionais de transcritos estão enriquecidas nesse tipo de amostra. Nossas análises revelaram que Caprin-1 apresenta uma preferência de ligação por regiões organizadas em forma de "stemloops" na estrutura secundária do mRNA. Adicionalmente, essas regiões estão enriquecidas em repetições "GG", que podem sugerir a formação de estruturas secundárias do tipo G-quadruplex, sendo mais estáveis para o nosso modelo encontrado que os loops. Do ponto de vista funcional, encontramos que os alvos identificados pelo CLIP-seq estão enriquecidos em transcritos codantes para proteínas da ligação ao RNA, associadas principalmente com processos catabólicos e controle do ciclo celular. Adicionalmente, comparamos as categorias enriquecidas com alterações preditas nas vias metabólicas obtidas a partir do RNA-seq, encontrando 19 vias que estão simultaneamente alteradas após expressão ectópica de Caprin-1 e enriquecidas nos alvos ligados a proteína nos grânulos de stress. Por fim, identificamos que sítios de ligação associados a Caprin-1, encontramos que estes apresentam uma tendência a apresentarem mais sítios de ligação microRNAs e estão associados também a outra proteina de ligação ao RNA chamada PUM2. Em conjunto, esses dados nos permitiram coletar informações importantes em relação ao papel da Caprin-1 nos grânulos de stress, tanto no campo de seleção de alvos de ligação bem como nas alterações funcionais decorrentes da expressão ectópica desta proteína. Nossos achados corroboram, com novas abordagens, alguns dados já sugeridos anteriormente pela literatura bem como propondo novos mecanismos que não haviam sido descritos previamente para esse modelo
Ver menos
Abstract: Part 1: Article ¿ BioFeatureFinder: Flexible, unbiased analysis of biological characteristics associated with genomic regions BioFeatureFinder (BFF) interrogates interesting genomic landmarks (including alternatively spliced exons, DNA/RNA-binding protein binding sites, and gene/transcript...
Ver mais
Abstract: Part 1: Article ¿ BioFeatureFinder: Flexible, unbiased analysis of biological characteristics associated with genomic regions BioFeatureFinder (BFF) interrogates interesting genomic landmarks (including alternatively spliced exons, DNA/RNA-binding protein binding sites, and gene/transcript functional elements) to identify distinguishing biological features (nucleotide content, conservation, k-mers, secondary structure, protein binding sites and others). BFF uses a flexible underlying model, combining classical statistical tests with big data machine learning strategies, that uses thousands of biological characteristics (features) to interpret category labels in genomic ranges or numerical scales from genome graphs. Our results show that BFF provides a reliable analysis platform for large-scale datasets, capable of recovering several well-known features from the literature for RNA-binding proteins as well as uncovering novel associations for 112 eCLIP-seq datasets. BioFeatureFinder is freely available at https://github.com/kbmlab/BioFeatureFinder/. Part 2: Identification of mRNA-targets and binding site characteristics for CAPRIN-1 RNA-binding protein using eCLIP-seq Stress granules are protein and RNA aggregates found in the cytoplasm of cells, in general are produced in response to a source of stress (ex. Hypoxia, viral infections, nutriente deprivation and heat shock). However, several neurodegenerative diseases, such as amyotrophic lateral sclerosis and Alzheimer¿s disease, have already been associated with pathogenic inclusions of these aggregates with harmful consequences for the cells. Amongst the proteins presente in the stress granule, the complex G3BP1-CAPRIN1-USP10 is essential for the condensation fo the granule and it¿s association with ribosomal subunits, with the ectopic expression of CAPRIN1 being suufficient to induce the formation of these aggregates. Although the molecular mechanisms associated with stress granules are not completely elucidated, the main functions postulated for these structures are: protection of RNAs from harmful situations, degradation of target mRNAs, selection of stress-response mRNAs for translation and reprogamming of overall gene expression. In order to characterize the mRNA-targets of Caprin-1 in stress granules, we used a combination of eCLIP-seq, RIP-seq and RNA-seq techiniques to identify the RNA binding sites for Caprin-1, as well as identifying which functional classes of transcripts are enriched in these samples. Our analysis revealed that Caprin-1 posesses a preference for binding to stemloops RNA secondary structures, additionally these regions were also enriched in GG repeats, which might suggest the formation of secondary structures known as G-quadruplexes, which are more stable than the stemloop model. From the functional standpoint, we found that targets identified by eCLIP-seq are enriched in transcripts coding for other RNA-binding proteins, associated mostly with catabolic processes and cell cycle control. Additionally, we compared the enriched categories with predicted alterations in metabolic pathways obtained from RNA-seq data. Overall, we found 19 pathways which are simultaneously enriched in eCLIP-seq targets and had significant alterations in their activation after CAPRIN1 ectopic expression. Lastly, we identified that Caprin-1 binding are also enriched in target sites for microRNAs and are associated with PUM2, another RNA binding protein. Taken together, our data allowed us to gather important information on the role of Caprin-1 in the stress granules, both for the selection of binding targets as well as the functional alterations resulting from the ectopic expression of this protein. Our finds corroborate, with new approaches, data previously suggested in the literature as well as propose novel mechanisms previously unreported for this model
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Identification of biological characteristics associated with RNA-binding proteins (RBPs) target sites [recurso eletrônico] = Identificação de características biológicas associadas a sítios-alvo de proteínas de ligação ao RNA (RBPs)
Felipe Eduardo Ciamponi
Identification of biological characteristics associated with RNA-binding proteins (RBPs) target sites [recurso eletrônico] = Identificação de características biológicas associadas a sítios-alvo de proteínas de ligação ao RNA (RBPs)
Felipe Eduardo Ciamponi