HVCFL : a study of centralized, decentralized and hybrid federated learning in vehicle networks with non-IID data
Luiz Fernando Rodrigues da Fonseca
DISSERTAÇÃO
Inglês
T/UNICAMP F733h
[HVCFL]
Campinas, SP : [s.n.], 2025.
1 recurso online (87 p.) : il., digital, arquivo PDF.
Orientador: Luiz Fernando Bittencourt
Dissertação (mestrado) - Universidade Estadual de Campinas (UNICAMP), Instituto de Computação
Resumo: Nos últimos anos, o Aprendizado Federado vem ganhando grande atenção por parte da comunidade científica, principalmente por permitir que modelos de aprendizado de máquina sejam treinados com grandes quantidades de dados de forma distribuída, e mantendo a privacidade dos dados dos usuários....
Ver mais
Resumo: Nos últimos anos, o Aprendizado Federado vem ganhando grande atenção por parte da comunidade científica, principalmente por permitir que modelos de aprendizado de máquina sejam treinados com grandes quantidades de dados de forma distribuída, e mantendo a privacidade dos dados dos usuários. Enquanto a arquitetura original desta abordagem foca em servidores centralizados que agregam os modelos treinados nos clientes, novas técnicas descentralizadas estão sendo propostas para melhorar a escalabilidade e robustez, já que não existe um agente centralizador como único ponto de falha. Entretanto, métodos descentralizados possuem uma maior deficiência quanto a quão rápida a informação se propaga na rede, pois cada cliente somente se comunica com seus vizinhos. Outro desafio que impacta ambas as abordagens são dados não-IID (Não Independentes e Identicamente Distribuídos), pois cada nó da rede pode possuir diferentes distribuições de dados, e um único modelo pode não ser suficiente para atender todos os clientes com uma boa performance. Ao mesmo tempo, com o advento hoje das redes móveis 5G, e posteriormente 6G, muitas aplicações que antes eram difíceis de serem implementadas estão ganhando espaço, como as VANETs (Redes Veiculares Ad Hoc). Estas são redes com protocolos de comunicação curta, onde veículos se comunicam somente com seus vizinhos próximos e com a infraestrutura de borda, como as Roadside Units (RSUs), apresentando desafios tanto para abordagens de aprendizado federado centralizadas, já que veículos podem não conseguir se comunicar a todo momento com a infraestrutura da rede, quanto para descentralizadas, uma vez que a rede é altamente dinâmica devido a mobilidade, dificultando a disseminação da informação. Desta forma, este trabalho propôs um método centralizado e outro híbrido de aprendizado federado para redes veiculares, chamados WSVC (Weight-Similarity Vehicle Clustering) e HVCFL (Hybrid Vehicle Clustered Federated Learning). Foram feitos extensos experimentos com diferentes conjuntos de dados e diversas distribuições não-IID, comparando seus resultados com métodos da literatura. Foram utilizadas ferramentas para simulação de redes veiculares, de forma que o ambiente experimental consiga reproduzir com maior fidelidade as características particulares destas redes, como potência de sinal de curto alcance, objetos que bloqueiam o sinal (Shadowing), e a mobilidade. Assim, com os resultados obtidos, foi possível listar pontos positivos e negativos de cada abordagem, como o WSVC convergindo mais rapidamente com menos mensagens trocadas quando a cobertura de RSUs era maior, e o HVCFL atingindo mais veículos, cobrindo toda a rede e conseguindo uma acurácia balanceada maior
Ver menos
Abstract: In the last few years, Federated Learning has gained an increased attention in the scientific community, especially for allowing machine learning models to be trained with a large quantity of data in a distributed way and keeping the privacy of user data. Although the original architecture...
Ver mais
Abstract: In the last few years, Federated Learning has gained an increased attention in the scientific community, especially for allowing machine learning models to be trained with a large quantity of data in a distributed way and keeping the privacy of user data. Although the original architecture of this approach focuses on centralized servers that aggregate the models trained by the clients, new decentralized techniques are being proposed to improve the scalability and robustness because there is no centralized agent as a single point of failure. However, decentralized methods have a greater deficiency in the speed with which information propagates through the network, since each client only communicates with its neighbors. Another challenge which impacts both strategies is non-IID data (Non-Independent and Identically Distributed), because each node in the network may possess different data distributions, and a single model might not be enough to accommodate every client with a good performance. At the same time, with the advent of the mobile 5G networks, and later 6G, many application that were hard to implement are gaining space, like VANETs (Vehicle Ad Hoc Networks). They are networks with short-range message protocols, where the vehicles only communicate with their nearest neighbors and with the edge infrastructure, like Roadside Units (RSUs), presenting challenges not only to centralized federated learning strategies, as vehicles might not be able to reach the network infrastructure all the time, but also to decentralized strategies, because the network is highly dynamic due to mobility, hindering the dissemination of information. Therefore, this work proposed one centralized and one hybrid method for federated learning in vehicle networks, called WSVC (Weight-Similarity Vehicle Clustering) and HVCFL (Hybrid Vehicle Clustered Federated Learning). Extensive experiments were performed with different datasets and non-IID data distributions, comparing their results with methods from the literature. Vehicle network simulation tools were used in a way that the experimental environment was able to reproduce with higher fidelity the specific features of these networks, such as short-range signal power, objects that block the signal (Shadowing), and mobility. Thus, with the results obtained, it was possible to list the pros and cons of each approach, such as WSVC having a faster convergence with fewer messages exchanged when the RSU coverage was larger, and HVCFL reaching more vehicles, covering all the network and achieving a higher balanced accuracy
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Aberto
HVCFL : a study of centralized, decentralized and hybrid federated learning in vehicle networks with non-IID data
Luiz Fernando Rodrigues da Fonseca
HVCFL : a study of centralized, decentralized and hybrid federated learning in vehicle networks with non-IID data
Luiz Fernando Rodrigues da Fonseca