Otimização da operação de abastecimento de linhas de produção em processos industriais através da integração de técnicas de aprendizado por reforço e simulação [recurso eletrônico] : um estudo com o Proximal Policy Optimization (PPO) no ambiente FlexSim
TCC
Português
TCC/UNICAMP Sa59o
Limeira, SP : [s.n.], 2023.
1 recurso on-line (70 p.) : il., digital, arquivo PDF.
Orientador: Anibal Tavares de Azevedo
Trabalho de Conclusão de Curso (graduação) - Universidade Estadual de Campinas, Faculdade de Ciências Aplicadas
Resumo: O projeto de Trabalho de Conclusão de Curso (TCC) tem como objetivo explorar a aplicação do algoritmo de Aprendizado por Reforço Proximal Policy Optimization (PPO) para otimizar o desempenho de Veículos Autônomos Guiados (AGVs, do inglês Automated Guided Vehicles) em ambientes de simulação...
Resumo: O projeto de Trabalho de Conclusão de Curso (TCC) tem como objetivo explorar a aplicação do algoritmo de Aprendizado por Reforço Proximal Policy Optimization (PPO) para otimizar o desempenho de Veículos Autônomos Guiados (AGVs, do inglês Automated Guided Vehicles) em ambientes de simulação utilizando o software Flexsim. Com o decorrer do tempo, tornou- se claro que os AGVs desempenham um papel fundamental na logística como uma tecnologia altamente valorizada em centros de distribuição, fábricas e armazéns. Desse modo, o seu pa- pel é crucial na promoção da eficiência logística e na prevenção de acidentes na indústria. O emprego do aprendizado por reforço nos AGVs tem potencial para trazer múltiplos benefícios, tais como aprimoramento da eficiência operacional e diminuição dos gastos relacionados à produção nesses ambientes industriais.Para o aumento dessa eficiência, faremos um estudo utilizando o algoritmo PPO de aprendizado por reforço, para treinarmos nosso modelo, for- necendo ao agente, punições e recompensas ao longo do aprendizado, que corroborem para a sua eficiência. O treinamento acontecerá utilizando Python integrado com o software Flex- Sim, onde servirá de ambiente de treinamento para o nosso algoritmo. Uma das metas funda- mentais deste projeto consiste em oferecer um método de otimização-simulação, empregando simulação multi-agentes e aprendizado por reforço. Além disso, foi feita uma análise acerca do desempenho do uso de métodos de aprendizagem por reforço que podem ser expandida para diversos outros contextos industriais nos quais sejam necessária a coordenação otimizada dos AGVs. Desejamos que os resultados gerados tenham uma aplicabilidade tangível em cenários do cotidiano, com o intuito de otimizar as operações em espaços industriais e minimizar o investimento logístico daqueles usando essa nova tecnologia
Requisitos do sistema: Software para leitura de arquivo em PDF