Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/358292
Type: DISSERTAÇÃO DIGITAL
Degree Level: Mestrado
Title: Deep reinforcement learning for bipedal locomotion : Aprendizado por reforço profundo para locomoção bípede
Title Alternative: Aprendizado por reforço profundo para locomoção bípede
Author: Soares, Yuri Corrêa Pinto, 1994-
Advisor: Colombini, Esther Luna, 1980-
Abstract: Resumo: Robótica e suas aplicações de serviço com robôs bípedes tem se expandido recentementedevido a possibilidade de se usar robôs desta categoria em ambientes originalmente plane-jados para operação humana. No entanto, locomoção bípede tem se mostrado um desafioteórico e prático devido a alta dimensionalidade do problema, visto que a ação de andartipicamente envolve o controle preciso em tempo-real de múltiplos atuadores e sensoresem conjunto com sistemas dinâmicos complexos. Concomitantemente, aprendizado porreforço (RL) e sua versão com redes neurais profundas (DRL) estão se tornando umaabordagem prominente para solucionar tais problemas, devido a sua capacidade de li-dar com processos contínuos e livres de modelo. Neste trabalho, modelamos a tarefade locomoção como um problema de aprendizagem por reforço, propondo representa-ções práticas baseada em MDPs e estratégias generalizáveis para funções de reforço. Emseguida, prosseguimos desenvolvendo um framework para integrar nosso simulador de es-colha (CoppeliaSim [11]) com a interface corrente padrão para aprendizagem por reforço(OpenAI Gym [5]). Finalmente, nós aplicamos algoritmos do estado-da-arte em apren-dizado por reforço profundo com nosso framework em experimentos configuráveis paravalidar nossa modelagem e aprender uma política de caminhada estável em simulaçãopara o robô Marta, um sofisticado robô humanoide com 25 graus de liberdade

Abstract: Robotics and its service applications with biped robots have faced an upsurge lately asthis category of robots is suitable for deployment in environments originally designed foroperation by humans. However, bipedal locomotion has proven to be a challenge in theoryand practice due to the problem¿s high dimensionality: as walking gaits typically involveprecise real-time control of multiple actuators and sensors, coupled with complex dynam-ical systems. Concomitantly, reinforcement learning (RL) and its deep neural networkversion (DRL) are becoming a prominent approach in solving such challenging controlproblems due to their capacity to work on continuous and model-free processes. In thiswork, we modeled a locomotion task as an RL problem by proposing practical MDP repre-sentations and generalizable reward engineering strategies. We then proceeded to developa framework for integrating our simulator of choice (CoppeliaSim [11]) with the de factostandard interface for Reinforcement Learning (OpenAI Gym [5]). Finally, we appliedstate-of-the-art DRL algorithms within our framework in configurable and reproducibleexperiments to validate our modeling and learn a stable walking gait in simulation for theMarta robot, a sophisticated humanoid robot with 25 DOFs
Subject: Aprendizado por reforço profundo
Caminhada bípede
Robótica
Language: Inglês
Editor: [s.n.]
Citation: SOARES, Yuri Corrêa Pinto. Deep reinforcement learning for bipedal locomotion: Aprendizado por reforço profundo para locomoção bípede. 2020. 1 recurso online (64 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: http://www.repositorio.unicamp.br/handle/REPOSIP/358292. Acesso em: 30 Mar. 2021.
Date Issue: 2020
Appears in Collections:IC - Tese e Dissertação

Files in This Item:
File SizeFormat 
Soares_YuriCorreaPinto_M.pdf7.58 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.