Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/332027
Type: DISSERTAÇÃO DIGITAL
Degree Level: Mestrado
Title: WorkflowHunt : a hybrid search mechanism for scientific workflow repositories = WorkflowHunt: um mecanismo de busca híbrida para repositórios de workflows científicos
Title Alternative: WorkflowHunt : um mecanismo de busca híbrida para repositórios de workflows científicos
Author: Beleño Diaz, Juan Sebastian, 1992-
Advisor: Medeiros, Claudia Maria Bauzer, 1954-
Abstract: Resumo: Os experimentos científicos e os conjuntos de dados gerados a partir deles estão crescendo em tamanho e complexidade. Os cientistas estão enfrentando dificuldades para compartilhar esses recursos e permitir a reprodutibilidade do experimento. Algumas iniciativas surgiram para tentar resolver esse problema. Uma delas envolve o uso de workflows científicos para representar a execução de experimentos científicos. Existe um número crescente de workflows que são potencialmente relevantes para mais de um domínio científico. Criar um workflow leva tempo e recursos e sua reutilização ajuda aos cientistas a criar novos workflows de forma mais rápida e confiável. No entanto, é difícil encontrar workflows adequados para reutilização. Geralmente, os repositórios de workflows possuem mecanismos de busca com muitas limitações, o que afeta negativamente a descoberta de workflows relevantes para um cientista ou seu time. Esta dissertação apresenta WorkflowHunt, uma arquitetura híbrida para busca e descoberta de workflows em repositórios genéricos, combinando busca baseada em palavras-chave e busca semântica para encontrar workflows relevantes usando diferentes métodos de busca. Ao contrário da maioria das pesquisas correlatas, nossa proposta e sua implementação são genéricas. Nosso sistema de indexação e anotação é automático e independe de domínio ou ontologia específica. A arquitetura foi validada por meio de um protótipo que usa workflows e metadados reais do myExperiment, um dos maiores repositórios de workflows científicos. Nosso sistema também compara seus resultados com o mecanismo de busca do myExperiment para analisar em que casos um sistema supera o outro

Abstract: Scientific experiments and the datasets generated from them are growing in size and complexity. Scientists are facing difficulties to share those resources in a way that allows reproducibility of the experiment. Some initiatives have emerged to try to solve this problem. One of them involves the use of scientific workflows to represent and enact the execution of scientific experiments. There is an increasing number of workflows that are potentially relevant for more than one scientific domain. Creating a workflow takes time and resources, and their reuse helps scientists to build new workflows faster and in a more reliable way. However, it is hard to find workflows suitable for reuse for an experiment. Usually, workflow repositories have search mechanisms with many limitations, which affects negatively the discovery of relevant workflows. This dissertation presents WorkflowHunt, a hybrid architecture for workflow search and discovery for generic repositories, which combines keyword and semantic search to find relevant workflows using different search methods. Unlike most related work, our proposal and its implementation are generic. Our indexing and annotation mechanism are automatic and not restricted to a specific domain or ontology. We validated our architecture creating a prototype that uses real workflows and metadata from myExperiment, one of the largest online scientific workflow repositories. Our system also compares its results with myExperiment¿s search engine to analyze in which cases one retrieval system outperforms the other
Subject: Fluxo de trabalho - Processamento de dados
Sistemas de recuperação da informação
Ontologias (Recuperação da informação)
Language: Inglês
Editor: [s.n.]
Citation: BELEÑO DIAZ, Juan Sebastian. WorkflowHunt: a hybrid search mechanism for scientific workflow repositories = WorkflowHunt: um mecanismo de busca híbrida para repositórios de workflows científicos. 2018. 1 recurso online (57 p.). Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP.
Date Issue: 2018
Appears in Collections:IC - Tese e Dissertação

Files in This Item:
File SizeFormat 
Diaz_JuanSebastianBeleno_M.pdf3.04 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.