Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos [recurso eletrônico]
Amaury Mausbach Filho
DISSERTAÇÃO
Português
T/UNICAMP M448a
[Application of recurrent neural networks to the design of antibodies from the amino acid sequence of epitopes]
Campinas, SP : [s.n.], 2021.
1 recurso online (92 p.) : il., digital, arquivo PDF.
Orientador: João Meidanis
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação
Resumo: Anticorpos são elementos criados pelo sistema imunológico adaptativo dos mamíferos, apartir da identificação de um epítopo (segmento de uma parte externa de um antígeno) estranho ao corpo hospedeiro, com a finalidade de combate específico ao epítopo identificado. O desenho de anticorpos a...
Ver mais
Resumo: Anticorpos são elementos criados pelo sistema imunológico adaptativo dos mamíferos, apartir da identificação de um epítopo (segmento de uma parte externa de um antígeno) estranho ao corpo hospedeiro, com a finalidade de combate específico ao epítopo identificado. O desenho de anticorpos a partir de epítopos tem sido muito pesquisado no tratamentode certas doenças virais, e de alguns tipos de câncer que não respondem de maneira eficaz aos tratamentos convencionais. Nesta pesquisa, procuramos obter dados para treino eteste de preditores computacionais de anticorpos a partir de epítopos, e desenhamos uma arquitetura para avaliação. Assim, alguns bancos de dados públicos de epítopos e anticorpos foram avaliados. Foi possível verificar que a escassez de registros para treino e teste diminui a riqueza de informações. Métricas consideradas mais relevantes para análisede proteínas foram revistas e adaptadas para funcionamento em sequências com preenchimento (padding), necessárias no caso do treino por lote. Um modelo de aprendizado profundo, baseado em processamento de linguagem natural e utilizando Redes Neurais Recorrentes para a predição de CDRs(Complementarity Determining Regions), as principais partes dos anticorpos, a partir de epítopos foi implementado e avaliado. Apesar do bom desempenho nos treinos, experimentamos uma situação persistente de overfitting com baixa generalização, mesmo após a aplicação de técnicas como weight decay, data augmentation e dropout. Por fim, lançamos mão de grid search, o que permitiu uma pequena melhora dos resultados quando da aplicação de weight decay
Ver menos
Abstract: Antibodies are elements created by the adaptive immune system of mammals, from the identification of an epitope (segment of an external part of an antigen) foreign to the human body, with the purpose of specifically combating the identified epitope. The design of antibodies from epitopes...
Ver mais
Abstract: Antibodies are elements created by the adaptive immune system of mammals, from the identification of an epitope (segment of an external part of an antigen) foreign to the human body, with the purpose of specifically combating the identified epitope. The design of antibodies from epitopes has been extensively researched in the treatment of certain viral diseases, and of some types of cancers that do not respond effectively to conventional treatments. Thus, some public databases of epitopes and antibodies were evaluated. It was possible to verify that the scarcity of records for training and testing reduces the wealth of information. Metrics considered most relevant for protein analysis were reviewed and adapted to function in padding sequences, necessary in the case of batch training. A deep learning model, based on natural language processing and using Recurrent Neural Networks to predict CDRs(Complementarity Determining Regions), the main parts of antibodies, from epitopes was implemented and evaluated. Despite the good performance in training, we experienced a persistent situation of overfitting with low generalization, even after applying techniques such as weight decay, data augmentation and dropout. Finally, we used grid search, which allowed a small improvement in results when applying weight decay
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos [recurso eletrônico]
Amaury Mausbach Filho
Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos [recurso eletrônico]
Amaury Mausbach Filho