Mapas geométricos de cenários celulares : teoria, ferramentas e aplicações em pneumologia, imunologia e neuroendocrinologia
Davi Sidarta Vitoria Rodrigues de Oliveira
TESE
Multilíngua
T/UNICAMP Si13m
[Geometric maps of cellular landscapes]
Campinas, SP : [s.n.], 2024.
1 recurso online (217 p.) : il., digital, arquivo PDF.
Orientador: Lício Augusto Velloso
Tese (doutorado) - Universidade Estadual de Campinas (UNICAMP), Faculdade de Ciências Médicas
Resumo: O advento das tecnologias de sequenciamento de RNA de células únicas revolucionou as ciências da vida, permitindo caracterizar a composição de tecidos, órgãos e organismos de acordo com tipos, estados e linhagens celulares. Além disso, sua aplicação conjunta com outras modalidades ômicas...
Ver mais
Resumo: O advento das tecnologias de sequenciamento de RNA de células únicas revolucionou as ciências da vida, permitindo caracterizar a composição de tecidos, órgãos e organismos de acordo com tipos, estados e linhagens celulares. Além disso, sua aplicação conjunta com outras modalidades ômicas contribuiu para o avanço do entendimento da ontologia, fisiologia e patologia de animais e humanos. Os dados gerados por essas técnicas são caracterizados pela sua alta dimensionalidade, de modo que sua análise só é possível com o uso de métodos de aprendizado de máquina capazes de representá-los em espaços latentes de menor dimensionalidade (ex. duas dimensões) em que linhagens e tipos celulares possam ser definidos, visualizados e interpretados. Apesar de várias técnicas para representar tal informação através de redução de dimensionalidade terem sido propostas, ainda é incerto como os espaços latentes resultantes desses métodos possam representar identidades celulares adequadamente. A complexidade dessas técnicas e a ausência de consenso sobre uma abordagem ideal causam incongruências em seu uso e dificultam a definição precisa de conceitos fundamentais como "tipo celular". Neste trabalho, abordamos esse impasse ao propor um modelo geométrico que representa a diversidade celular e permite definir tais conceitos. Demonstramos que a diversidade celular pode ser representada como variedades (espaços) de Riemann utilizando análise topológica de dados e teoria espectral. Desenvolvemos ferramentas computacionais do estado-da-arte para representar tais variedades em espaços de menor dimensionalidade para sua análise e visualização, além de avaliá-los quantitativa e qualitativamente. Demonstramos a utilidade dessas ferramentas na exploração de fenômenos biológicos com dados públicos. Inicialmente, as aplicamos para descrever como a maturação de pneumócitos no pulmão humano está associada à regulação do sistema renina-angiotensina e impacta na patofisiologia da COVID-19. Em seguida, empregamos tais ferramentas para identificar novas subpopulações de linfócitos T no sangue, líquido cefalorraquidiano e órgãos periféricos, e mostramos que nossas ferramentas identificam subtipos transcricionais associados a clonotipos específicos pelo transcriptoma. Por fim, ao combinar essas ferramentas com alinhamento de variedades, realizamos uma meta-análise de dados públicos que detalha a composição celular do núcleo arqueado do hipotálamo murino e humano, além de gerar uma referência interespécies. Coletivamente, esse trabalho propõe a representação geométrica da diversidade celular de sistemas biológicos, implementa ferramentas computacionais para tanto, e exemplifica sua aplicação em diversos campos, com implicações em infectologia, imunologia, neurociência e metabolismo. Acreditamos que esses avanços serão úteis na exploração de dados biológicos em larga escala e na geração de hipóteses, portanto contribuindo para o avanço do conhecimento nas ciências da vida, em especial envolvendo a busca de novos alvos terapêuticos e desenvolvimento de medicina de precisão
Ver menos
Abstract: The advent of single-cell RNA sequencing technologies has revolutionised the life sciences, enabling the characterisation of the composition of tissue, organ, and organism in terms of cell types, states, and lineages. Moreover, their integration with other omics modalities has contributed...
Ver mais
Abstract: The advent of single-cell RNA sequencing technologies has revolutionised the life sciences, enabling the characterisation of the composition of tissue, organ, and organism in terms of cell types, states, and lineages. Moreover, their integration with other omics modalities has contributed to advances in understanding animal and human ontology, physiology, and pathology. The data generated by these techniques are highly-dimensional, and its analysis is only possible by employing machine learning methods capable of representing them in lower-dimensional latent spaces (e.g., two dimensions), where cell lineages and types can be defined, visualised, and interpreted. While various techniques for representing such information via dimensionality reduction have been proposed, it remains uncertain how the resulting latent spaces from these methods can adequately represent cell identities. The complexity of these techniques and the lack of consensus on an ideal approach cause inconsistencies in their use and hinder the precise definition of fundamental concepts such as "cell type." In this work, we address this impasse by proposing a geometric model that represents cellular diversity and allows for the definition of such concepts. We demonstrate that cellular diversity can be represented as Riemannian manifolds using topological data analysis and spectral theory; develop state-of-the-art computational tools to represent such manifolds in lower-dimensional spaces for their analysis and visualisation, as well as to evaluate them quantitatively and qualitatively; and demonstrate the usefulness of these tools in exploring biological phenomena with public data. We first apply them to describe how the maturation of pneumocytes in human lungs is associated with the renin-angiotensin system regulation and impacts the pathophysiology of COVID-19. Next, we employ these tools to identify new subpopulations of T lymphocytes in blood, cerebrospinal fluid, and peripheral organs, showing that our tools identify transcriptional subtypes associated with specific clonotypes by the transcriptome. Finally, by combining our tools with manifold alignment, we conduct a meta-analysis of public data detailing the cellular composition of the murine and human arcuate nucleus of the hypothalamus, as well as generating an interspecies reference. Collectively, this work proposes geometric representations of cellular diversity in biological systems, implements computational tools for this purpose, and exemplifies its application in various fields, with implications to infectology, immunology, neuroscience, and metabolism. We believe that these advances will be valuable in exploring large-scale biological data and generating hypotheses, thus contributing to the advancement of knowledge in the life sciences, particularly involving the search for new therapeutic targets and the development of precision medicine
Ver menos
Aberto
Velloso, Licio Augusto, 1963-
Orientador
Mori, Marcelo Alves, 1980-
Avaliador
Vinolo, Marco Aurélio Ramirez, 1982-
Avaliador
Nakaya, Helder Takashi Imoto
Avaliador
Leiria, Luiz Osório, 1983-
Avaliador
Mapas geométricos de cenários celulares : teoria, ferramentas e aplicações em pneumologia, imunologia e neuroendocrinologia
Davi Sidarta Vitoria Rodrigues de Oliveira
Mapas geométricos de cenários celulares : teoria, ferramentas e aplicações em pneumologia, imunologia e neuroendocrinologia
Davi Sidarta Vitoria Rodrigues de Oliveira