Análise de sensibilidade do NVIDIA DIGITS aos parâmetros do processamento de imagens [recurso eletrônico]
Caroline Lucas Calheirani
TCC
Português
TCC DIGITAL/UNICAMP C128a
Campinas, SP : [s.n.], 2020.
1 recurso online (44 p.) : il., digital, arquivo PDF.
Orientador: André Franceschi de Angelis
Trabalho de Conclusão de Curso (graduação) - Universidade Estadual de Campinas, Faculdade de Tecnologia
Resumo: A classificação de imagens é uma área da tecnologia da informação que vem sendo utilizada para desenvolver pesquisas, criar novas tecnologias ou aprimorar algumas já existentes. Na classificação de imagens, pode ser usada a Inteligência Artificial (IA), que permite o reconhecimento de...
Ver mais
Resumo: A classificação de imagens é uma área da tecnologia da informação que vem sendo utilizada para desenvolver pesquisas, criar novas tecnologias ou aprimorar algumas já existentes. Na classificação de imagens, pode ser usada a Inteligência Artificial (IA), que permite o reconhecimento de padrões para que, posteriormente, consigam ser mapeados. Dentre as diversas técnicas computacionais que englobam a IA, uma delas é representada pelas Redes Neurais, que podem reconhecer padrões e ter a capacidade de aprendizagem através de treinamento. Um dos programas existentes para treinar essas redes é o DIGITS. Ele facilita a tarefa de classificação de imagens, segmentação e detecção de objetos. Porém, para que seu resultado seja eficiente, é necessário que haja o melhor uso dos parâmetros de operação. Este trabalho teve por objetivo o estudo de alguns desses através da análise de sensibilidade, com o intuito de redução de treinamento e melhoria da acurácia. Para tanto, houve a definição dos parâmetros Training epochs (100, 200, 500 e 1.000), Base learning rate (0.01, 0.10 e 1.00) e Standard networks (AlexNet e GoogLeNet), configuradas com o framework Caffe. Além disso, alternou-se a quantidade de imagens (100, 500, 1000 e 2000), a fração de treinamento (25%, 50%, 75% e 100%) e quatro modelos de geração de sequência de imagens (Moving Point, Rotating Point, Triple Cloud e Gaussian Cloud). De acordo com os parâmetros escolhidos, foram realizados 1.152 testes, resultando em 10 conjuntos de dados relevantes para o objetivo descrito. Concluiu-se que, para os modelos analisados, independente da rede, é aconselhável o uso de poucas imagens e training epochs. Dependendo do modelo, é necessário a adequação da taxa de aprendizagem. Para os modelos Moving Point, Rotating Point e Triple Cloud a standard networks AlexNet, foi considerada a melhor para os treinamentos, assim como a fração de treinamento 75%. O modelo Gaussian Cloud mostrou-se contrário aos outros modelos, sendo indiferente a essas configurações. Essas conclusões permitem que haja redução no volume de dados, no tempo de processamento, e na sobrecarga de parâmetros, proporcionando a otimização de futuros trabalhos com o DIGITS
Ver menos
Abstract: Image classification is an area of information technology that has been used to develop research, create new technologies, or improve existing ones. In the classification of images, Artificial Intelligence (AI) can be used, which allows the recognition of patterns so that they can be...
Ver mais
Abstract: Image classification is an area of information technology that has been used to develop research, create new technologies, or improve existing ones. In the classification of images, Artificial Intelligence (AI) can be used, which allows the recognition of patterns so that they can be mapped. Among the various computational techniques that include AI, one of them is represented by Neural Networks, which can recognize patterns and have the ability to learn through training. One of the existing programs to train these networks is DIGITS. It facilitates the task of image classification, segmentation and object detection. However, for its result to be efficient, it is necessary to make the best use of the operating parameters. This work aimed to study some of these through sensitivity analysis, with the aim of reducing training and improving accuracy. For that, the parameters Training epochs (100, 200, 500 and 1,000), Base learning rate (0.01, 0.10 and 1.00) and Standard networks (AlexNet and GoogLeNet) were defined, configured with the Caffe framework. In addition, the number of images (100, 500, 1000 and 2000), the training fraction (25%, 50%, 75% and 100%) and four image sequence generation models (Moving Point, Rotating Point, Triple Cloud and Gaussian Cloud). According to the chosen parameters, 1,152 tests were carried out, resulting in 10 data sets relevant to the described objective. It was concluded that, for the analyzed models, regardless of the network, it is advisable to use a few images and training epochs. Depending on the model, it is necessary to adjust the learning rate. For the Moving Point, Rotating Point and Triple Cloud models, the AlexNet standard networks were considered the best for training, as well as the training fraction 75%. The Gaussian Cloud model proved to be contrary to the other models, being indifferent to these configurations. These conclusions allow a reduction in the volume of data, in the processing time, and in the overload of parameters, providing the optimization of future works with DIGITS
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Análise de sensibilidade do NVIDIA DIGITS aos parâmetros do processamento de imagens [recurso eletrônico]
Caroline Lucas Calheirani
Análise de sensibilidade do NVIDIA DIGITS aos parâmetros do processamento de imagens [recurso eletrônico]
Caroline Lucas Calheirani