Avaliação de desempenho de redes neurais convolucionais utilizando imagens sintéticas [recurso eletrônico]
Paulo Luis Zampieri
DISSERTAÇÃO
Português
T/UNICAMP Z14a
[Performance assessment of convolutional neural networks using synthetic images]
Limeira, SP : [s.n.], 2021.
1 recurso online (120 p.) : il., digital, arquivo PDF.
Orientador: Andre Franceschi de Angelis
Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Tecnologia
Resumo: A utilização de classificadores de imagens através de Deep Learning (DL) ou aprendizado profundo é uma das tendências tecnológicas que vem sendo amplamente utilizada. Esta técnica tem evoluído e, através das Redes Neurais Convolucionais (CNN), utilizando aprendizagem supervisionada, é capaz...
Ver mais
Resumo: A utilização de classificadores de imagens através de Deep Learning (DL) ou aprendizado profundo é uma das tendências tecnológicas que vem sendo amplamente utilizada. Esta técnica tem evoluído e, através das Redes Neurais Convolucionais (CNN), utilizando aprendizagem supervisionada, é capaz de extrair atributos, identificar padrões e reconhecer imagens. Os objetivos principais deste trabalho foram avaliar a acurácia dos classificadores de imagens utilizando as redes GoogLeNet e AlexNet, combinados com os frameworks, TensorFlow, Caffe e Torch, e determinar quais as melhores configurações (hiperpârametros) a serem utilizados nas CNN. Em relação à literatura em geral, o diferencial desta pesquisa é o uso de sequências de imagens com padrões correlacionados por componentes estáticos (forma) e dinâmicos (movimentação). No que diz respeito a trabalhos específicos com sequências de imagens, as novidades são o uso de conjuntos diversos de padrões e a comparação de frameworks. Foram utilizadas 50.000 imagens sintéticas rotuladas (geradas por software), distribuídas em 25 conjuntos distintos, para a execução dos testes, com padrões simples, perceptíveis por pessoas, como a distância entre pontos, ângulos em vértices, cobertura de áreas e densidade de pontos. A escolha dos parâmetros para utilização na CNN se deu através de testes preliminares. A avaliação de desempenho baseou-se nos indicadores de acurácia de nível 1 e 5. Os resultados demonstraram que a ferramenta utilizada neste trabalho, o DIGITS da Nvidia, consegue fazer classificações com percentual de acerto similar às encontradas na literatura em outros domínios de aplicação. A rede AlexNet com o TensorFlow foi que apresentou melhor resultado, 88,84%, seguida pelo Torch, 79,37% e o Caffe com 61,61%. Já a rede GoogLeNet apresentou resultados inferiores, com 44,92% com o Torch e 55,49% com o Caffe. Diversos contextos podem se beneficiar dos resultados aqui obtidos e da metodologia empregada, inclusive em termos de comparação de desempenho (benchmark)
Ver menos
Abstract: The application of image classifiers through Deep Learning (DL) has become a widely used technological trend. Through the Convolutional Neural Networks (CNN), this technique has evolved and, using supervised learning, it is able to extract features, identify patterns, and recognize images....
Ver mais
Abstract: The application of image classifiers through Deep Learning (DL) has become a widely used technological trend. Through the Convolutional Neural Networks (CNN), this technique has evolved and, using supervised learning, it is able to extract features, identify patterns, and recognize images. The main aims of this work were to evaluate the accuracy of the image classifiers using GoogLeNet and AlexNet networks, combined with the frameworks, TensorFlow, Caffe and Torch and determine the best configurations (hiperparameters) to be used in the CNNs. In relation to the literature in general, the differential of this research is the use of image sequences with patterns correlated by static (shape) and dynamic (movement) components. Regarding specific works with image sequences, the novelties are the use of different sets of patterns and the comparison of frameworks. Distributed in 25 different datasets, approximately 50,000 labeled synthetic images (generated by software) were used to perform the tests. The images had simple patterns perceptible by people, such as the distance between points, angles at vertices, and density of points. To choose the parameters to be used on the CNNs, some tests were carried out to determine the best values. The performance evaluation was based on level 1 and 5 accuracy indicators. The results showed that the tool used in this work, Nvidia's DIGITS, can classify images with the accuracy like those found in the literature in other application domains. AlexNet network with TensorFlow showed the best results, 88.84%, followed by Torch, 79.37% and Caffe with 61.61%. GoogLeNet network presented lower results, with 44.92% with Torch and 55.49% with Caffe. Other application domains can benefit from the results of this work and the methodology used, including in terms of performance comparison (benchmark)
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Avaliação de desempenho de redes neurais convolucionais utilizando imagens sintéticas [recurso eletrônico]
Paulo Luis Zampieri
Avaliação de desempenho de redes neurais convolucionais utilizando imagens sintéticas [recurso eletrônico]
Paulo Luis Zampieri