Buscar
  • Daniel Takata

Usando estatística e machine learning para encontrar um jogador mais em conta para seu time

Talvez você tenha assistido ao filme Moneyball: O Homem que Mudou o Jogo, com Brad Pitt.


É inspirado no livro de mesmo nome.


Resumidamente, conta a história de como Billy Beane, dirigente do time de beisebol Oakland Athletics dos Estados Unidos, levou a equipe a disputar as primeiras posições em 2002. E ele conseguiu isso em uma situação financeira desfavorável, contratando jogadores renegados por outras equipes, explorando estatísticas e verificando que tais jogadores tinham potencial para formar uma equipe competitiva.


Sim, os números podem revelar bem mais do que nossa intuição consegue.


O Liverpool, atual time sensação da Europa no futebol, adotou um procedimento parecido nos últimos anos, guardadas as devidas proporções - afinal de contas o clube inglês tem bastante dinheiro, mas longe de gastar os tubos como Barcelona, Real Madrid, Bayern de Munique e outras potências europeias.





Aqui apresentamos uma metodologia de como identificar jogadores com características e potencial semelhantes a outros, em meio a uma possível infinidade de jogadores e dados.


Dessa forma, é possível identificar um jogador que pode ser bem mais barato para contratação, ao invés daquele medalhão caríssimo e que na prática oferece resultados parecidos.


Observe o gráfico a seguir (se desejar enxergar melhor, clique em cima para maximizá-lo).





O gráfico é referente aos dados de alguns jogadores selecionados do jogo FIFA 18.


Foram consideradas mais de 30 variáveis referentes a características dos jogadores, como velocidade, drible, força, visão de jogo, marcação etc.


Os valores para cada variável variam de 0 a 100, indicando o nível de cada jogador em cada quesito.


O objetivo aqui é agrupar os jogadores mais similares entre si, através de uma técnica estatística denominada Análise de Agrupamentos - também associada a algoritmos de machine learning.


(neste caso, foi utilizada uma técnica de agrupamento hierárquico, com ligação completa e distância euclideana para similaridade.)


O gráfico que ilustra os resultados é chamado de

dendograma.


Por exemplo, observe esse pedaço do dendograma:





É possível observar que os jogadores De Gea, Neuer, Lloris, ter Stegen, Courtois e Navas estão em um grupo bem distinto dos demais jogadores. No gráfico, esse agrupamento específico está indicado pelo ramo 1. Obviamente tal agrupamento foi formado devido às características específicas desses jogadores, que são goleiros.


O ramo 2, por sua vez, traz jogadores como Boateng, Chielini, Carvajal, Marcelo, Casemiro, Thiago Silva, Sergio Ramos, David Luiz e Piqué. Jogadores com funções basicamente defensivas.


Mas, mesmo dentro desse ramo, há outras separações.


Por exemplo, Sergio Busquets, Casemiro e Khedira encontram-se em um subgrupo separado de Thiago Silva, Sergio Ramos e David Luiz. Os três primeiros são volantes e os três últimos são zagueiros, o que indica que, apesar de esses seis jogadores terem mais em comum entre si do que com os goleiros do grupo 1, também há diferença entre subgrupos dentro do grupo 2.


Então, suponha que o Barcelona tenha um problema com Piqué e deseje contratar um jogador com características similares para repor seu elenco. Pelos agrupamentos obtidos, os mais cotados seriam Javi Martinez e Vincent Kompany, ao invés de ir atrás, por exemplo, de Chielini ou Thiago Silva.





Observando os jogadores ofensivos, nota-se que os mais similares ao argentino Lionel Messi são Neymar, Hazard e Robben. Já os mais similares a Cristiano Ronaldo são Lewandowski e Cavani.


Utilizamos uma amostra de pouco mais de 60 jogadores para ilustrar o método e fazer com que dendograma não fique muito poluído, mas é possível realizar a análise para conjuntos muito maiores.


Em conjuntos de dados muito grandes, a análise é muito valiosa, já que é muito difícil, quando se trata de muitas observações e muitas variáveis, de detectar similaridades apenas observando os números.


Imagine fazer a análise para todos os jogadores dos principais campeonatos da Europa. Dessa maneira, agrupamentos muito interessantes podem aparecer. É possível que se detecte um jogador de um clube intermediário na França que tenha características semelhantes, por exemplo, à estrela De Bruyne, do Manchester City.


Suponha também que o Real Madrid deseje contratar De Bruyne, mas descubra esse promissor jogador francês, cujo valor pode ser dezenas de vezes menor em comparação ao belga. A contratação poderia ser uma pechincha (para as proporções de um clube como o Real Madrid, claro) e poderia sobrar dinheiro para buscar outros jogadores talentosos pela mesma metodologia. Ao invés de trazer somente um jogador, pode-se contratar três ou quatro, ou até mais, sem perda de qualidade.


Deixemos claro que os dados utilizados aqui são relacionados a níveis de atributos dos jogadores em um jogo de video game. Mas é possível utilizar dados reais, como números de passes, finalizações, dribles, desarmes etc, para fazer análise semelhante. Há empresas especializadas que disponibilizam para compra tais bases de dados, e os grandes clubes as utilizam de forma intensa.


O desafio é saber exatamente quais informações são relevantes para a comparação de jogadores, e é aí que um profissional da área do esporte é indispensável para esse tipo de análise. A estatística jamais caminha sozinha.

357 visualizações

Entre em contato

Caso tenha dúvidas, críticas, sugestões ou simplesmente queira entrar em contato, preencha o formulário e clique em "Enviar".
  • LinkedIn Social Icon
  • Facebook Social Icon
  • Instagram
  • Twitter Social Icon
  • YouTube

© 2019 por Daniel Takata.