Development of an automated data processing pipeline for Serial Synchrotron Crystallography on MANACÁ (Sirius) [recurso eletrônico] = Desenvolvimento do fluxo de processamento automático de dados para Cristalografia Serial em Síncrotron na MANACÁ (Sirius)
Ana Carolina Rodrigues
DISSERTAÇÃO
Inglês
T/UNICAMP R618d
[Desenvolvimento do fluxo de processamento automático de dados para Cristalografia Serial em Síncrotron na MANACÁ (Sirius)]
Campinas, SP : [s.n.], 2021.
1 recurso online (117 p.) : il., digital, arquivo PDF.
Orientadores: Ana Carolina de Mattos Zeri, Eduardo Granado Monteiro da Silva
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Física Gleb Wataghin
Resumo: Manacá (MAcromolecular micro and NAno CrystAllography), primeira linha de luz em fase de comissionamento no Sirius (LNLS/CNPEM), é dedicada a diversos experimentos de cristalografia aplicadas em pequenas e macromoléculas, incluindo a recente técnica de cristalografia serial (SX). SX utiliza...
Ver mais
Resumo: Manacá (MAcromolecular micro and NAno CrystAllography), primeira linha de luz em fase de comissionamento no Sirius (LNLS/CNPEM), é dedicada a diversos experimentos de cristalografia aplicadas em pequenas e macromoléculas, incluindo a recente técnica de cristalografia serial (SX). SX utiliza o feixe de microfoco e alto fluxo de fontes de luz avançadas, como o Sirius, para adquirir padrões únicos de difração de milhares de cristais por experimento, possivelmente, à temperatura ambiente. Um dos maiores desafios para SX é a união de conjuntos de dados parciais, aleatoriamente orientados no espaço recíproco, como se tivessem sido obtidos a partir da rotação de cristal único. Quanto ao dado final, o objetivo principal é extrair os melhores resultados dentro de uma variedade de combinações possíveis entre os subconjuntos de dado. Para solucionar isso, tem sido aplicados diferentes algoritmos, cada um com seus respectivos parâmetros a serem ajustados para toda coleta de dados. O objetivo dessa dissertação é fornecer uma rotina de processamento automático de dados para experimentos de SX realizados na Manacá. Construímos um script, em Python, que agirá como uma interface entre os usuários e os programas que estão sendo desenvolvidos para SX (CrystFEL, nXDS, cctbx.xfel, ccCluster, BLEND, xscale_isocluster, entre outros). Os usuários poderão chamar, de forma prática, diferentes programas de processamento, otimizar os parâmetros que melhor ajustem os seus dados, explorar visualmente as figuras de mérito e escolher as melhores opções de processamento. A fim de testar nossa rotina de processamento automático de dados, realizamos três experimen- tos durante o comissionamento científico da Manacá. Primeiramente, foram medidos 21 cristais de AmeGH128, no modo de oscilação (9.15 keV, tamanho de feixe variando de 20 a 60 µm), em 77K. Desse experimento, obtivemos um total de cerca de 64800 padrões de difração. Em seguida, cole- tamos 64 cristais de lisozima criocongelados, em modo grid-scan (12.69 keV, tamanho do feixe de 25 µm, fluxo de 10¹² ph/s). Nesse experimento, foram coletadas 2910 imagens no total. O mesmo experimento foi realizado em 20 cristais de lisozima em temperatura ambiente, utilizando um porta-amostra desenvolvido internamente pelo nosso grupo, selado com Kapton. Nessas condiçõs, nós obtivemos um total de 601 imagens. Os padrões de difrações obtidos foram usados como entrada para duas principais vias de proces- samento de SX: Hierarchical Cluster Analysis HCA (ccCluster) e imagens instantâneas (CrystFEL). Nosso script pôde indexar os padrões de difração com sucesso, de acordo com os parâmetros de célula unitária já conhecidos. Nosso fluxo de processamento de dados é versátil para verificação da qualidade dos dados e ajuste de parâmetros. Na rotina de imagens instantâneas, melhor qualidade final dos dados pode ser atingida, refinando a taxa de indexação e aumentando o número de cris- tais coletados. Todavia, a ferramenta de processamento de dados de SX é funcional e customizável para os usuários da Manacá. SX é uma promessa para o estudo de dinâmica de proteínas resolvida no tempo, e na descoberta de proteínas que são difíceis de cristalizar, como estruturas de proteínas de membrana. Possibilitar essa técnica na Manacá terá grande impacto em diversas áreas, desde descobrimento de drogas para tratamentos efetivos de doenças até otimização da produção de biocombustíveis renováveis
Ver menos
Abstract: Manacá (MAcromolecular micro and NAno CrystAllography), first beamline in commissioning at Sirius (LNLS/CNPEM), is dedicated to a range of crystallography experiments applied to small and macro molecules, including the most recent technique of serial crystallography (SX). SX takes...
Ver mais
Abstract: Manacá (MAcromolecular micro and NAno CrystAllography), first beamline in commissioning at Sirius (LNLS/CNPEM), is dedicated to a range of crystallography experiments applied to small and macro molecules, including the most recent technique of serial crystallography (SX). SX takes advantage of microfocus beam and higher flux from advanced light sources, such as Sirius, to acquire unique diffraction patterns from several tens of thousands of microcrystals per experiment, possibly, at room temperature. One of the biggest challenges for SX is to merge partial datasets, randomly oriented in the reciprocal space, as if they had been obtained from a single crystal rotation. Regarding final data, the main goal is to extract the best results from a range of all possible subdataset combination. To solve this, it has been applied different algorithms, each with their respective parameters that should be adjusted to every data collection. The aim of this dissertation is to provide an automated data processing pipeline for SX experiments on Manacá. We have built a script, in Python, that will act as an interface between users and new software being developed for SX (CrystFEL [5], nXDS, cctbx.xfel, ccCluster[3], BLEND[4], xscale isocluster, among others). Users will be able to, with minimal effort, call different data processing programs, adjust parameters that best fit their data, visually explore the figures of merit and choose the best data processing options. In order to test our data processing pipelines, we have performed three experiments during the Manacá’s scienctific commisioning. Firstly, it was measured 21 crystals of AmeGH128, in oscillation mode (9.15 keV, beam size varying from 20 to 60 µm ), at 77K. From that experiment, we obtained a total of around 64800 diffraction patterns. Afterwards, we collected 64 cryocooled lysozyme crystals, in grid-scan mode (12.69 keV, beam size 25 µm, flux at sample 10¹² ph/s). In this experiment, it was collected 2910 images in total. The same experiment was done on 20 lysozyme crystals at room-temperature, using an in-house build sample device, sealed with Kapton. In this condition, we obtained a total of 601 images. The diffraction patterns were used as an input for the two main branches of SX data processing: Hierarchical Cluster Analysis HCA (ccCluster) and snapshot images routine (CrystFEL). Our script could successfully index the diffraction patterns, according to the already known unit cell parameters. Our SX automatic data processing pipeline is versatile for immediate data quality verification and software parameters adjustments. In the snapshot routine, better final data quality might be achieved by tuning the indexing rate and increasing the number of crystals measured. Nevertheless, the SX data processing tool is functional and customizable for Manacá future users. Serial Crystallography is a huge promise for the study of time-resolved protein dynamics and in the revealing of proteins structures that are extremely difficult to crystallize, as membrane protein structures. Enabling this technique on Manacá will have a great impact in a variety of fields, from drug discovery for effective treatment of diseases to the optimization of renewable biofuels production
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Zeri, Ana Carolina de Mattos
Orientador
Silva, Eduardo Granado Monteiro da, 1974-
Coorientador
Nonato, Maria Cristina
Avaliador
Cezar, Júlio Criginski, 1972-
Avaliador
Development of an automated data processing pipeline for Serial Synchrotron Crystallography on MANACÁ (Sirius) [recurso eletrônico] = Desenvolvimento do fluxo de processamento automático de dados para Cristalografia Serial em Síncrotron na MANACÁ (Sirius)
Ana Carolina Rodrigues
Development of an automated data processing pipeline for Serial Synchrotron Crystallography on MANACÁ (Sirius) [recurso eletrônico] = Desenvolvimento do fluxo de processamento automático de dados para Cristalografia Serial em Síncrotron na MANACÁ (Sirius)
Ana Carolina Rodrigues