Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/332027
Full metadata record
DC FieldValueLanguage
dc.contributor.CRUESPUNIVERSIDADE ESTADUAL DE CAMPINASpt_BR
dc.descriptionOrientador: Claudia Maria Bauzer Medeirospt_BR
dc.descriptionDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computaçãopt_BR
dc.format.extent1 recurso online (57 p.) : il., digital, arquivo PDF.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languageInglêspt_BR
dc.relation.requiresRequisitos do sistema: Software para leitura de arquivo em PDFpt_BR
dc.typeDISSERTAÇÃO DIGITALpt_BR
dc.titleWorkflowHunt : a hybrid search mechanism for scientific workflow repositories = WorkflowHunt: um mecanismo de busca híbrida para repositórios de workflows científicospt_BR
dc.title.alternativeWorkflowHunt : um mecanismo de busca híbrida para repositórios de workflows científicospt_BR
dc.contributor.authorBeleño Diaz, Juan Sebastian, 1992-pt_BR
dc.contributor.advisorMedeiros, Claudia Maria Bauzer, 1954-pt_BR
dc.contributor.institutionUniversidade Estadual de Campinas. Instituto de Computaçãopt_BR
dc.contributor.nameofprogramPrograma de Pós-Graduação em Ciência da Computaçãopt_BR
dc.subjectFluxo de trabalho - Processamento de dadospt_BR
dc.subjectSistemas de recuperação da informaçãopt_BR
dc.subjectOntologias (Recuperação da informação)pt_BR
dc.subject.otherlanguageWorkflow - Data processingen
dc.subject.otherlanguageInformation storage and retrieval systemsen
dc.subject.otherlanguageOntologies (Information retrieval)en
dc.description.abstractResumo: Os experimentos científicos e os conjuntos de dados gerados a partir deles estão crescendo em tamanho e complexidade. Os cientistas estão enfrentando dificuldades para compartilhar esses recursos e permitir a reprodutibilidade do experimento. Algumas iniciativas surgiram para tentar resolver esse problema. Uma delas envolve o uso de workflows científicos para representar a execução de experimentos científicos. Existe um número crescente de workflows que são potencialmente relevantes para mais de um domínio científico. Criar um workflow leva tempo e recursos e sua reutilização ajuda aos cientistas a criar novos workflows de forma mais rápida e confiável. No entanto, é difícil encontrar workflows adequados para reutilização. Geralmente, os repositórios de workflows possuem mecanismos de busca com muitas limitações, o que afeta negativamente a descoberta de workflows relevantes para um cientista ou seu time. Esta dissertação apresenta WorkflowHunt, uma arquitetura híbrida para busca e descoberta de workflows em repositórios genéricos, combinando busca baseada em palavras-chave e busca semântica para encontrar workflows relevantes usando diferentes métodos de busca. Ao contrário da maioria das pesquisas correlatas, nossa proposta e sua implementação são genéricas. Nosso sistema de indexação e anotação é automático e independe de domínio ou ontologia específica. A arquitetura foi validada por meio de um protótipo que usa workflows e metadados reais do myExperiment, um dos maiores repositórios de workflows científicos. Nosso sistema também compara seus resultados com o mecanismo de busca do myExperiment para analisar em que casos um sistema supera o outropt
dc.description.abstractAbstract: Scientific experiments and the datasets generated from them are growing in size and complexity. Scientists are facing difficulties to share those resources in a way that allows reproducibility of the experiment. Some initiatives have emerged to try to solve this problem. One of them involves the use of scientific workflows to represent and enact the execution of scientific experiments. There is an increasing number of workflows that are potentially relevant for more than one scientific domain. Creating a workflow takes time and resources, and their reuse helps scientists to build new workflows faster and in a more reliable way. However, it is hard to find workflows suitable for reuse for an experiment. Usually, workflow repositories have search mechanisms with many limitations, which affects negatively the discovery of relevant workflows. This dissertation presents WorkflowHunt, a hybrid architecture for workflow search and discovery for generic repositories, which combines keyword and semantic search to find relevant workflows using different search methods. Unlike most related work, our proposal and its implementation are generic. Our indexing and annotation mechanism are automatic and not restricted to a specific domain or ontology. We validated our architecture creating a prototype that uses real workflows and metadata from myExperiment, one of the largest online scientific workflow repositories. Our system also compares its results with myExperiment¿s search engine to analyze in which cases one retrieval system outperforms the otheren
dc.publisher[s.n.]pt_BR
dc.date.issued2018pt_BR
dc.identifier.citationBELEÑO DIAZ, Juan Sebastian. WorkflowHunt: a hybrid search mechanism for scientific workflow repositories = WorkflowHunt: um mecanismo de busca híbrida para repositórios de workflows científicos. 2018. 1 recurso online (57 p.). Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP.pt_BR
dc.description.degreelevelMestradopt_BR
dc.description.degreedisciplineCiência da Computaçãopt_BR
dc.description.degreenameMestre em Ciência da Computaçãopt_BR
dc.contributor.committeepersonalnameCarvalho, Benilton de Sápt_BR
dc.contributor.committeepersonalnameReis, Júlio César dospt_BR
dc.date.defense2018-05-03T00:00:00Zpt_BR
dc.date.available2018-09-04T13:51:27Z-
dc.date.accessioned2018-09-04T13:51:27Z-
dc.description.provenanceMade available in DSpace on 2018-09-04T13:51:27Z (GMT). No. of bitstreams: 1 Diaz_JuanSebastianBeleno_M.pdf: 3111054 bytes, checksum: a1be0ec19c455c7f90697fcf30910f49 (MD5) Previous issue date: 2018en
dc.identifier.urihttp://repositorio.unicamp.br/jspui/handle/REPOSIP/332027-
dc.description.sponsorCAPESpt_BR
Appears in Collections:IC - Tese e Dissertação

Files in This Item:
File SizeFormat 
Diaz_JuanSebastianBeleno_M.pdf3.04 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.