Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/358572
Type: TESE DIGITAL
Degree Level: Doutorado
Title: New approach to analyse the passing in soccer matches using multivariate and machine learning techniques : Nova abordagem para análise do passe em jogos de futebol usando técnicas multivariadas e aprendizagem de máquina
Title Alternative: Nova abordagem para análise do passe em jogos de futebol usando técnicas multivariadas e aprendizagem de máquina
Author: Merlin, Murilo, 1980-
Advisor: Cunha, Sergio Augusto, 1959-
Abstract: Resumo: Tradicionalmente, no contexto prático e científico, as varáveis usadas para explicar desempenho individual e coletivo relacionados a capacidade de executar passes fornecem informações insuficientes para melhora do desempenho. As principais variáveis usadas como indicador de desempenho ao analisar passes são percentuais de passes bem sucedidos e tempo de posse de bola, no caso de sequência de passes. O objetivo geral desta pesquisa foi propor uma nova abordagem para analisar o passe em partidas de futebol utilizando técnicas multivariadas e de aprendizagem de máquina (ML). Os objetivos específicos foram propostos com base em dois tipos de análise: análise da posse de bola (BP) (Estudo 1), e análise do passe (Estudos 2 e 3). Foram analisadas quatro partidas oficiais do Campeonato Brasileiro de Futebol 2016. No estudo 1 foram usadas 41 variáveis preditoras 'notacionais', 'ocupação do espaço' e 'sincronização de deslocamento'. As BP foram classificadas em três grupos por meio de técnicas de agrupamento: curta, média e longa. A análise discriminante de Fisher (FDA) identificou cinco variáveis mais relevantes para descrever cada grupo, sugerindo comportamentos coletivos que ajudam a manter a BP e realizar passes. O segundo e o terceiro estudos focaram suas análises no conceito de dificuldade de passe, que norteou a proposição de 36 variáveis relacionadas ao passe, pressão sobre o passador, pressão sobre receptor do passe, trajetória da bola, posição no campo e técnicas do passador. Em ambos os estudos, usamos uma amostra com 465 passes rotulados por experts. Os passes foram classificados como baixa dificuldade (Low-DP), média dificuldade (Medium-DP) e alta-dificuldade (High-DP). No estudo 2, a FDA apresentou 72,0 % de acurácia ao classificar o grau de dificuldade de passagem em três classes. Além disso, foram identificadas 16 entre 32 variáveis que melhor explicam o grau de dificuldade do passe no futebol. No estudo 3, melhoramos a previsão classificando os passes usando algoritmos de ML. O support vector machine (SVM), modelo não linear, alcançou acurácia balanceada de 88% em seu melhor desempenho. Em seguida, usamos esse modelo para predizer uma nova amostra de passes (total = 2.522) e analisar jogadores e posições. High-DP apresentou apenas 49,3% de passes bem sucedidos, seguido por 84,0% para Medium-PD e 94,9% para Low-PD. Essas variáveis foram usadas como inputs na análise de componentes principais (PCA). A principal componente (PC1) apresentou maior correlação com a variável acertos em High-DP e Medium-DP, sugerindo que é mais importante considerar a capacidade do jogador em executar passes de alta e média dificuldade do que passes de baixa dificuldade. Além disso, os scores da PC1 foram usados para classificar os melhores passadores. Os modelos e variáveis propostos podem ser usados por treinadores em um contexto prático para analisar seus jogadores e equipes, a fim de melhorar o desempenho na execução de passes, visto que os passes são determinantes do sucesso em partidas de futebol.

Abstract: Traditionally, in the practical and scientific context, the variables used to explain individual and collective performance related to the ability to perform passes provide insufficient information to improve performance. The main variables used as a performance indicator when analyzing the passes are the percentage of successful passes and time of ball possession in the case of pass sequences. The general objective of this research was to propose a new approach to analyze the passing in soccer matches using multivariate and machine learning techniques. The specific objectives were proposed based on two types of analysis: ball possession (BP) analysis (Study 1), and passing analysis (Studies 2 and 3). Were analyzed four official matches of the Brazilian Soccer Championship 2016. In study 1 were used 41 'notational', ‘space occupation’, and 'displacement synchronization’ predictor variables. The BP were classified into three groups using clustering techniques: short, medium and long. Fisher discriminant analysis (FDA) identified the five most relevant variables to describe each group, suggesting collective behaviors that help to maintain BP and perform passes. The second and third study focused their analyzes on the concept of passing difficulty, that guided the proposition of 36 variables related to the pass, pressure on the passing player, pressure on the passing receiver, ball trajectory, pitch position and passing player techniques. In both studies, we used a sample with 465 passes labelled by experts. The passes were classified such low difficulty (Low-DP), medium difficult (Medium-DP) and high difficulty (High-DP). In study 2, the FDA presented 72.0% of accuracy when classifying the degree of passing difficulty into three classes. In addition, were identified 16 between 32 variables that best explain the degree of passing difficulty in soccer. In study 3, we improved the prediction by classifying passes using machine learning algorithms. The support vector machine (SVM), a non-linear model, reaching a balanced accuracy of 88% in their best performance. Then we use this model to predict a new sample of passes (total = 2,522), and to analyze players e positions. The High-DP had a success rate of 49.3% only, followed by 84.0% for Medium-DP and 94.9% for Low-DP. These variables were used as input in the principal component analysis (PCA). The principal component (PC1) showed a higher correlation with the variable accuracy in High-DP and Medium-DP, suggesting that it is more important to consider the player's ability to complete High-PD and Medium-DP than Low-DP. In addition, the PC1 scores were used to rank the best passing players. The models and variables propose can be used by coaches in a practical context to analyze passing performance of their players and teams, in order to improve performance in performing passes, considering that the passes are the important determinants of success in soccer matches.
Subject: Passe (Futebol)
Futebol
Rastreamento (Posição)
Análise multivariada
Inteligência artificial
Language: Português
Editor: [s.n.]
Citation: MERLIN, Murilo. New approach to analyse the passing in soccer matches using multivariate and machine learning techniques : Nova abordagem para análise do passe em jogos de futebol usando técnicas multivariadas e aprendizagem de máquina . 2020. 1 recurso online ( 98 p.) Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Educação Física, Campinas, SP.
Date Issue: 2020
Appears in Collections:FEF - Tese e Dissertação

Files in This Item:
File SizeFormat 
Merlin_Murilo_D.pdf2.02 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.