Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/309732
Type: TESE
Degree Level: Doutorado
Title: Aplicação de modelos estatísticos e desenvolvimento de algoritmos para estudo genético de doenças neuro-psiquiátricas
Title Alternative: Statistical models application and algorithm development for genetic studies in neuropsychiatric diseases
Author: Secolin, Rodrigo
Advisor: Lopes-Cendes, Íscia Teresinha, 1964-
Cendes, Iscia Teresinha Lopes, 1964-
Abstract: Resumo: Fatores genéticos têm sido descritos para diversas doenças do sistema nervoso central. Uma etapa importante na identificação de genes responsáveis por estas doenças são os estudos de mapeamento genético. Além disso, devido às novas tecnologias de aquisição de dados de genótipos dos indivíduos, é necessário o estudo e desenvolvimento de programas de processamento de grande quantidade de dados para as análises estatísticas. Os objetivos deste trabalho foram: 1) criar uma interface entre os equipamentos de aquisição de dados de genótipos e os programas estatísticos, por meio de programas de processamento de dados; 2) aplicar e avaliar os modelos estatísticos em amostras de famílias segregando três doenças neuro-psiquiátricas: epilepsia do lobo temporal mesial (ELTM), polimicrogiria perisylviana bilateral congênita (PPBC) e transtorno afetivo bipolar (TAB). A interface foi desenvolvida a partir de um algoritmo lógico, o qual adiciona a matriz dos dados dos genótipos provenientes dos equipamentos em uma matriz representativa dos dados das famílias. Este algoritmo, denominado JINGLEFIX, foi programado em linguagem de computador PERL e ambiente R e utilizado posteriormente nos estudos de mapeamento genético da ELTM, PPBC e TAB. Análise de segregação foi realizada em 148 famílias nucleares com ELTM, com um total de 698 indivíduos, visto que esta síndrome não possui padrão de herança conhecido. Uma família, segregando PPBC com um total de 15 indivíduos e um padrão conhecido de herança ligada ao X dominante, foi submetida à análise paramétrica de ligação por meio do pacote de programas LINKAGE, utilizando 18 marcadores microssátelites na região candidata Xq27-Xq28. Análise não paramétrica de ligação realizada em uma amostra de 74 famílias segregando TAB, totalizando 411 indivíduos, por meio do teste de transmissão de desequilíbrio de ligação (TDT), utilizando 21 single nucleotide polymosphisms (SNPs) para 21 regiões candidatas. A análise de segregação revelou a presença de um gene de maior efeito com um padrão autossômico dominante, além da presença de genes de menor efeito influenciando no fenótipo da ELTM. O posterior mapeamento genômico da ELTM, utilizando os parâmetros definidos na análise de segregação, revelou ligação genética na região 18p11. A análise paramétrica de ligação genética levou ao mapeamento da região Xq27 para a família com PPBC, diferente da região candidata previamente descrita. Esta diferença pode ser explicada pelo tipo de amostra familiar utilizada pelos dois estudos. Em relação ao TAB, a análise não paramétrica identificou a região candidata 3p22. Posterior estudo de refinamento da região 3p21-3p22 utilizando 94 SNPs adicionais e estudo de expressão gênica identificou o gene ITGA9 como possível gene de susceptibilidade para o TAB. Comparando o poder estatístico entre as análises, foi observado maior poder estatístico na análise paramétrica utilizando uma ou poucas famílias, com um número grande de indivíduos por família; enquanto que o poder estatístico foi maior nas análises não paramétricas utilizando múltiplas famílias de tamanhos moderados e estruturas variadas. Conclui-se que o algoritmo de processamento de dados e a adequada aplicação dos modelos estatísticos são fundamentais para sucesso do mapeamento genético das regiões e dos genes responsáveis pelas doenças neuro-psiquiátricas estudadas

Abstract: Genetic factors have been described for several central nervous system diseases. A main step for disease gene identification is genetic mapping study. In addition, due new genotype acquire technology, the development of genotype processing data software is required. The objectives of this work were: 1) to generate interface between genotype equipment and statistical software by processing data algorithm; 2) to apply and evaluate statistical models in family sample segregating three neurological diseases: mesial temporal lobe epilepsy (MTLE), bilateral perysilvian polymicrogyria (BPP) and bipolar affective disorder (BPAD). Data interface was developed from a logic algorithm, which adds a genotype matrix data from equipment to a family data matrix. This algorithm, called JINGLEFIX, was implemented in PERL computer language and R environment. In addition, this software was used in genetic mapping study for MTLE, BPP and BPAD. Segregation analysis was performed in 148 nuclear MTLE pedigrees, with a total of 698 individuals, since this syndrome has not known inheritance pattern. One BPP pedigree with known X-linked dominant pattern of inheritance, with a total of 15 individuals, was submitted to parametric linkage analysis by LINKAGE package, using 18 microsatellite markers on candidate region Xq27-Xq28. Non-parametric linkage analysis was performed from 74 BPAD families, with a total of 411 individuals, by transmission disequilibrium test (TDT) and using 21 single nucleotide polymorphisms (SNPs) for 21 candidate regions. Segregation analysis revealed a major effect gene with an autosomal dominant pattern of inheritance and minor gene effect, which could influence MTLE phenotype. Further whole genome analysis mapped the putative MTLE major gene on 18p11. Parametric linkage analysis mapped Xq27 locus for BPP, a different region compared to the Xq28 previous described. This difference could be explained to sample type used by the two studies. Non-parametric linkage for BPAD identified the candidate region on 3p22. Further studies using 94 additional SNPs on 3p21-3p22 and gene expression analysis identified ITGA9 as susceptibility gene for BPAD. A comparison of statistical power between statistical analyses showed a high statistical power for parametric linkage analysis from one or a few large families; whereas a high statistical power was observed for non-parametric linkage analysis using several moderate size families. The conclusion of this study is that data processing algorithm and adequate statistical model applying are fundamental tools for successful of genetic mapping of complex diseases
Subject: Bioinformática
Genética médica
Neurogenética
Language: Português
Editor: [s.n.]
Date Issue: 2011
Appears in Collections:FCM - Tese e Dissertação

Files in This Item:
File SizeFormat 
Secolin_Rodrigo_D.pdf5.73 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.