Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/354865
Type: DISSERTAÇÃO DIGITAL
Degree Level: Mestrado
Title: Proteômica baseada em descoberta para busca de alvos terapêuticos e biomarcadores potenciais utilizando-se análises univariadas e multivariadas
Title Alternative: Discovery-based proteomics for the search for therapeutic targets and potential biomarkers using univariate and multivariate analyzes
Author: Domingues, Romênia Ramos, 1982-
Advisor: Leme, Adriana Franco Paes
Abstract: Resumo: Biomarcadores são essenciais no diagnóstico, prognóstico e desenvolvimento de fármacos. Sua pesquisa deve envolver alta sensibilidade e seletividade, definindo resultados claros de confirmação ou exclusão da doença, bem como alta qualidade na metodologia analítica, em métodos computacionais e estatísticos. O sucesso de biomarcadores em testes clínicos tem sido pequeno e uma das razões é que poucos candidatos à biomarcadores passam por uma validação rigorosa por meio de modelos estatísticos, como também pequenos números de amostras biológicas, variabilidade biológica resultando em falsos positivos. Dessa forma, o objetivo desse estudo é aplicar modelos estatísticos de análise que ajudem a selecionar biomarcadores candidatos na fase de descoberta, classificá-los e validá-los para posterior aplicação em uma nova fase de verificação, como proteômica baseada em alvos. Para isso, foram analisadas amostras de saliva de pacientes com e sem carcinoma de células escamosas (CEC) contendo 4 proteínas recombinantes em concentrações crescentes. Após a identificação e quantificação das proteínas utilizando o algoritmo de busca do Andromeda integrado no MaxQuant, os dados foram analisados pelos métodos de Kruskal-Wallis, Wilcoxon, Nearest Shrunken Centroid (NSC), Random Forest e Support Vector Machine ¿ Recursive Feature Elimination (SVM-RFE), seguidos de métodos de validação como validação cruzada, permutação e Curvas de Características de Operação do Receptor (ROC). Os resultados mostram que as análises de Kruskal-Wallis e Wilcoxon foram capazes de detectar as proteínas marcadoras adicionadas nas amostras de saliva em concentrações crescentes como verdadeiros positivos. Houve melhora na classificação das amostras para as análises de Random Forest e NSC quando proteínas as proteínas foram filtradas pelo valor de p, com exceção para a análise de SVM-RFE. Da mesma forma, em relação ao ranqueamento, as proteínas marcadoras tiveram uma melhora na posição do ranqueamento quando os dados foram filtrados pelo valor de p para NSC, mas não para SVM-RFE. Por meio da análise das curvas ROC foi possível verificar o limite de sinal e ruído para discriminar corretamente cada classe de paciente. Os resultados sugerem que trabalhar com os dados filtrados pelo valor de p aumenta o acerto na classificação dos pacientes para as análises de Random Forest e NSC, entretanto, o mesmo não acontece para a análise utilizando SVM-RFE

Abstract: Biomarkers are essential in diagnosis, prognosis and drug development. It demands high sensibility and specificity to obtain results that confirm or exclude diseases, as well as high quality in analytical, computational and statistical methods. However, the success of biomarkers in clinical trials has been limited, and some reasons are that few candidate biomarkers are rigorously validated by statistical models, and likely, the use of small numbers of biological samples together with high biological variability results in many false positives. Therefore, the goal this study is to apply statistical models to help select candidate biomarkers in discovery phase and classify them for further application in a new verification step such as targeted proteomics. For that, human saliva samples originated from patients with and without Oral Squamous cell Carcinoma (OSCC) were analyzed by LC-MSMS with four recombinant proteins spiked in the samples. After protein identification and quantification performed with Andromeda search algorithm within MaxQuant, the data were analyzed by Kruskal-Wallis, Wilcoxon, Nearest Shrunken Centroid (NSC), Random Forest and Support Vector Machine ¿ Recursive Feature Elimination (SVM-RFE), followed by validation analysis such as cross-validation, permutation and ROC curves. The results showed that Kruskal-Wallis and Wilcoxon were able to detect the spiked recombinant proteins in saliva samples in increasing concentration as true positives. There was an improvement in sample classification in Random Forest and NSC analyses when the input data were proteins that were previously filtered by p-value, except for SVM-RFE. Similarly, in relation to the ranking analysis, the recombinant proteins improved their position when previously filtered by the p-value for the NSC analysis, but not for the SVM-RFE. ROC curves showed the signal noise limit for the correct discrimination of each patient class. The results suggest that data filtered by p-value improve the correct classification of patients for Random Forest and NSC analysis, but not for SVM-RFE analysis
Subject: Marcadores biológicos
Proteômica
Análise multivariada
Bioestatística
Language: Português
Editor: [s.n.]
Citation: DOMINGUES, Romênia Ramos. Proteômica baseada em descoberta para busca de alvos terapêuticos e biomarcadores potenciais utilizando-se análises univariadas e multivariadas. 2017. 1 recurso online ( 78 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia, Campinas, SP.
Date Issue: 2017
Appears in Collections:IB - Tese e Dissertação

Files in This Item:
File SizeFormat 
Domingues_RomeniaRamos_M.pdf1.83 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.