Improved knowledge sharing in ticket repositories [recurso eletrônico] : a genetic algorithm approach for feature selection = Melhorando o compartilhamento de conhecimento em repositórios de tickets: uma abordagem de algoritmo genético para seleção de características
DISSERTAÇÃO
Inglês
T/UNICAMP OL4i
[Melhorando o compartilhamento de conhecimento em repositórios de tickets]
Campinas, SP : [s.n.], 2020.
1 recurso online (79 p.) : il., digital, arquivo PDF.
Orientadores: Mário Lucio Côrtes, Ricardo da Silva Torres
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação
Resumo: Gestão do conhecimento é essencial para qualquer organização. As empresas precisam ser capazes de produzir, organizar, salvar, recuperar e compartilhar conhecimento com eficiência. As empresas de software não são diferentes de outras empresas, produzindo conhecimento continuamente em larga...
Resumo: Gestão do conhecimento é essencial para qualquer organização. As empresas precisam ser capazes de produzir, organizar, salvar, recuperar e compartilhar conhecimento com eficiência. As empresas de software não são diferentes de outras empresas, produzindo conhecimento continuamente em larga escala. Essas empresas geralmente geram centenas de milhares de tickets por dia por meio de ferramentas de gerenciamento de projetos, como Jira, Bugzilla e Trello. Neste contexto, o compartilhamento apropriado de conhecimento sem automação é extremamente difícil ou até impossível. A chance de perder informações valiosas ao longo do tempo é alta. Para solucionar este problema, desenvolvemos um sistema de recomendação em que, para cada novo ticket, o sistema analisa e classifica os tickets relevantes no repositório para ajudar os usuários compartilhando conhecimentos e lições aprendidas em casos semelhantes anteriores. O sistema de recomendação é baseado no {\em Vector Space Model (VSM)} com TF-IDF e medida de similaridade cosseno. Os experimentos revelaram resultados positivos, mostrando que o VSM é uma técnica adequada para classificar tickets relevantes. Em combinação com o sistema de recomendação, foi desenvolvida uma técnica de seleção de características baseada no algoritmo genético e uma nova abordagem que o aprimora heuristicamente. O sistema de recomendação com seleção de características obteve resultados positivos (todos os resultados foram validados estatisticamente) em comparação ao método que se baseia no modelo tradicional de espaço vetorial, sem nenhum procedimento de seleção de características. A precisão aumentou em quase 23%, o tempo médio de pesquisa por consulta reduziu em 44% e o tamanho do vetor reduziu em 64%
Abstract: Knowledge management is essential for any organization. Corporations need to be capable of producing, organizing, saving, retrieving, and sharing knowledge efficiently. Software corporations are not different from any other businesses, producing knowledge continuously on a large scale....
Abstract: Knowledge management is essential for any organization. Corporations need to be capable of producing, organizing, saving, retrieving, and sharing knowledge efficiently. Software corporations are not different from any other businesses, producing knowledge continuously on a large scale. Such companies often generate hundreds of thousands of tickets per day through project management tools, such as Jira, Bugzilla, and Trello. In this context, appropriate knowledge sharing without automation is extremely difficult or even impossible. The chance of losing valuable information through time is high. To address this issue, we have developed a recommendation system where, for each new ticket, the system analyses and ranks relevant tickets on the repository to help users to share knowledge and lessons learned from previous similar cases. The recommendation system is based on the Vector Space Model (VSM) with TF-IDF and cosine similarity. The experiments revealed positive results showing that the VSM is a suitable technique to rank relevant tickets. In combination with the VSM recommendation system, a feature selection technique based on Genetic Algorithm, and a novel approach that heuristically improves the well-known Genetic Algorithm were developed. The recommendation system with feature selection had positive results, where all results were statistically validated, compared with the method that relies on the traditional vector space model without any feature selection procedure. The precision increased by almost 23%, the average search time by query reduced by almost 44%, and the vector size reduced by 64%
Requisitos do sistema: Software para leitura de arquivo em PDF