Modelagens para segmentação de imagens 3D da densidade eletrônica de ligantes em classes químicas com aprendizado profundo [recurso eletrônico]
Cristina Freitas Bazzano
DISSERTAÇÃO
Português
T/UNICAMP B349m
[Modeling for segmentation of 3D images of eletronic density of ligands in chemical classes with deep learning]
Campinas, SP : [s.n.], 2022.
1 recurso online (148 p.) : il., digital, arquivo PDF.
Orientadores: Guilherme Pimentel Telles, Daniela Barretto Barbosa Trivella
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação
Resumo: A megadiversidade biológica brasileira, resultante de ecossistemas únicos manipulados e conservados por meio de um manejo agroflorestal milenar de diversos povos tradicionais do Brasil, têm um grande potencial para acelerar a descoberta de novos fármacos nacionais e representa importante...
Ver mais
Resumo: A megadiversidade biológica brasileira, resultante de ecossistemas únicos manipulados e conservados por meio de um manejo agroflorestal milenar de diversos povos tradicionais do Brasil, têm um grande potencial para acelerar a descoberta de novos fármacos nacionais e representa importante fonte de inovação. Produtos naturais (PN) são a principal fonte de novos fármacos, historicamente inspirando mais de 60\% dos fármacos hoje disponíveis. Os PN são moléculas orgânicas produzidas por qualquer ser vivo como decorrência de seu metabolismo secundário. Porém, a descoberta de novos fármacos a partir de PNs é muito desafiadora, os métodos convencionais para isolar o composto ativo consomem tempo, recursos e muitas vezes precisam de quilogramas do extrato do PN, o que pode ser inviável algumas vezes. Nesse contexto, surge a necessidade de novas técnicas e análises que aceleram e facilitam o processo de elucidação da estrutura molecular de moléculas bioativas desconhecidas. Atividades recentes do grupo de pesquisa deste trabalho e alguns poucos outros no mundo mostram que a cristalografia de proteínas em larga escala é uma alternativa para esse cenário. Esta técnica permite obter uma imagem 3D do contorno da molécula desconhecida em um menor tempo e a partir de poucos microgramas do extrato do PN. A incubação do cristal de uma proteína alvo com o extrato natural bioativo - que é representado por uma mistura de centenas de produtos naturais inicialmente desconhecidos - é uma técnica promissora na descoberta de novos fármacos e a interpretação da imagem 3D da densidade eletrônica é uma abordagem central neste processo. As soluções existentes resolvem o problema da interpretação da densidade eletrônica de moléculas já conhecidas e comumente encontradas nos bancos de dados de cristalografia de proteínas, o que não abrange o universo de moléculas de PNs, muitas das quais desconhecidas e com estrutura complexa pouco comum. Este trabalho fornece uma solução para o problema da reconstrução da estrutura molecular de ligantes (moléculas bioativas) desconhecidos a partir de uma modelagem com aprendizado profundo para interpretação automatizada da imagem 3D da densidade eletrônica dos dados de cristalografia de proteínas. Diversas modelagens baseadas em subestruturas químicas dos ligantes foram avaliadas para criação de bancos de dados de imagens em nuvens de pontos 3D da densidade eletrônica de ligantes rotuladas e os modelos de segmentação semântica obtidos apresentaram bom desempenho, com acurácias mIoU no teste entre 50,5\% e 77,4\%. As contribuições deste trabalho incluem: a primeira aplicação de aprendizado profundo 3D para imagens da densidade eletrônica de ligantes; um arcabouço de funções para implementação de outras modelagens na criação de imagens 3D da densidade eletrônica de ligantes; os bancos de dados de imagens rotuladas criados; os modelos treinados; e uma aplicação automatizada chamada \emph{$NP^3$ Blob Label} para detecção de ligantes na densidade eletrônica e interpretação das suas imagens 3D utilizando os modelos obtidos
Ver menos
Abstract: The Brazilian biological megadiversity, resulting from unique ecosystems manipulated and conserved through an ancient agroforestry management of several traditional populations of Brazil, has great potential to accelerate the discovery of new national drugs and represents an important...
Ver mais
Abstract: The Brazilian biological megadiversity, resulting from unique ecosystems manipulated and conserved through an ancient agroforestry management of several traditional populations of Brazil, has great potential to accelerate the discovery of new national drugs and represents an important source of innovation. Natural products (NP) are the main source of new drugs, historically inspiring more than 60\% of the drugs available today. NPs are organic molecules produced by any living being as a result of their secondary metabolism. However, the discovery of new drugs from NPs is very challenging, conventional methods to isolate the active compound consume time, resources and frequently need kilograms of the NP extract, which can sometimes be unfeasible. In this context, there is a need for new techniques and analyzes that accelerate and facilitate the process of elucidating the molecular structure of unknown bioactive molecules. Recent activities by the research group of this work and a few others in the world show that large-scale protein crystallography is an alternative to this scenario. This technique makes it possible to obtain a 3D image of the contour of the unknown molecule in a shorter time and from a few micrograms of the NP extract. The incubation of a target protein crystal with the bioactive natural extract - which is represented by a mixture of hundreds of initially unknown natural products - is a promising technique in the discovery of new drugs and the interpretation of the 3D electron density image is a central approach in this process. Existing solutions solve the problem of interpreting the electron density of molecules already known and commonly found in protein crystallography databases, which does not cover the universe of NP molecules, many of which are unknown and with an unusual complex structure. This work provides a solution to the problem of reconstructing the molecular structure of unknown ligands (bioactive molecules) from modeling with deep learning for automatic interpretation of the 3D electron density image of protein crystallography data. Several modeling based on chemical substructures of ligands were evaluated to create labeled imaging databases in 3D point clouds of the electron density of ligands. The semantic segmentation models obtained showed good performance, with mIoU accuracies in the test between 50.5\% and 77.4\%. Contributions of this work include: the first 3D deep learning application for electron density imaging of ligands; a framework of functions to implement other modeling to create 3D images of the electron density of ligands; the created labeled image databases; the trained models; and an automated application named \emph{$NP^3$ Blob Label} for detecting ligands in electron density and interpretation of their 3D images using the obtained models
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Telles, Guilherme Pimentel, 1972-
Orientador
Trivella, Daniela Barretto Barbosa, 1980-
Coorientador
Pedrini, Hélio, 1963-
Avaliador
Oliveira, Paulo Sérgio Lopes de, 1969-
Avaliador
Modelagens para segmentação de imagens 3D da densidade eletrônica de ligantes em classes químicas com aprendizado profundo [recurso eletrônico]
Cristina Freitas Bazzano
Modelagens para segmentação de imagens 3D da densidade eletrônica de ligantes em classes químicas com aprendizado profundo [recurso eletrônico]
Cristina Freitas Bazzano