Buscar
  • Daniel Takata

Como calcular probabilidades de resultados de jogos de futebol?


(foto: reprodução/statisticsports.com)

Você já parou para pensar em como se calculam as probabilidades de resultados de jogos de futebol?


Afinal de contas, quando dizem que seu time tem 35% de chances de ser campeão, ou 20% de chances de ser rebaixado, esses números saíram de algum lugar.


Os analistas calculam as probabilidades dos resultados dos jogos e utilizam as combinações de resultados para chegar nesses números.


Logo, o primeiro passo é saber como essas probabilidades dos resultados dos jogos são calculadas.


Existem maneiras diferentes de fazer isso.


Aqui, apresento uma das mais conhecidas e utilizadas.


Mas antes, sigam o raciocínio.


Nos 10 Campeonatos Brasileiros realizados entre 2009 e 2018, em 50% dos jogos o time mandante venceu o jogo. Em 27% das ocasiões houve empate e em 23% das disputas a vitória foi para o time visitante.


Se analisarmos os campeonatos ano a ano, perceberemos que esses percentuais não variam muito.


Ou seja, se um sujeito apostar em todos os jogos do campeonato de um determinado ano no time mandante, ele irá acertar em cerca de 50% das ocasiões.


Mas talvez precisemos considerar mais informações.


Por exemplo, nas rodadas finais do campeonato brasileiro de 2018, o Palmeiras, então líder, enfrentou o Paraná, já matematicamente rebaixado. E o Paraná era o mandante.


Talvez não fosse ideal considerar que o Paraná tivesse 50% de chances de vencer o jogo só porque era o mandante. Afinal, tinha um time muito inferior ao do Palmeiras. Provavelmente, teria bem menos chance de vencer.


(e, de fato, não venceu - o jogo terminou 1 a 1)


Paraná x Palmeiras pelo Campeonato Brasileiro de 2018 (foto: reprodução/UOL Esporte)

Por isso, podemos refinar esse cálculo. Afinal de contas, as probabilidades são influenciadas por outros fatores, como aproveitamento dos times no campeonato, número de craques no elenco, número de desfalques etc.


No entanto, é muito difícil fazer as análises baseadas somente em percentuais observados.


Por exemplo, suponha que o time mandante tenha 40% de aproveitamento no campeonato, contra 60% do visitante.


Para ter uma ideia das probabilidades de vitória, empate e derrota, precisaríamos observar os resultados passados de vários jogos em que o mandante tinha 40% de aproveitamento e o visitante, 60%.


E, talvez, não tenhamos muitos jogos para calcular os percentuais, e dessa forma podem representar as verdadeiras probabilidades de modo muito impreciso.


Isso sem falar se considerarmos outras informações adicionais.


Por isso, podemos recorrer a um modelo estatístico denominado modelo de regressão logística, indicado para o cálculo de probabilidades baseado em informações auxiliares, como é o caso.


No último vídeo no canal do Esportístico no YouTube, dou mais detalhes acerca do método.




O procedimento é relativamente simples.


(os números que aparecerão nos parágrafos a seguir referem-se a um modelo de regressão logística que obtive utilizando dados do campeonato brasileiro de 2016)


Primeiro, determinam-se pesos para as informações disponíveis. Por exemplo, o fato de um time jogar em casa certamente aumenta sua probabilidade de vitória. Logo, isso seria representado por um peso positivo. No caso, foi obtido 0,33.


O aproveitamento do time também tem um peso positivo, afinal um bom aproveitamento indica que o time está em um bom momento no campeonato. Aqui também teríamos um peso positivo (valor calculado de 0,48), que multiplicaria o aproveitamento.


O aproveitamento do time adversário, por sua vez, tem um peso negativo. Afina, se o time adversário tiver um bom aproveitamento, em tese fica mais difícil para o time em questão derrotá-lo. Aqui, teríamos um peso negativo (valor calculado de -1,04), que multiplicaria o aproveitamento do adversário.


Se o time mandante tem aproveitamento de 40% e o adversário de 60%, teríamos 0,33 + 0,48 x 40% - 1,04 x 60% = - 0,10.


Então, a probabilidade de vitória é de -10%? Claro que não, afinal isso não faria sentido.


Há ainda um passo faltando no procedimento, que é obter o valor de uma certa função aplicada em -0,10. Essa função é chamada de logística - daí o nome do modelo.


A fórmula da função logística é exibida a seguir:


O atrativo dessa função é que ela sempre resulta em valores entre 0 e 1, ou seja, entre 0 e 100%.


Substituímos o valor de x por -0,10 e temos o resultado de 0,47, ou 47%.


Logo, nesse caso, a probabilidade de vitória do time em questão seria de 47%.


E como são obtidos os valores dos pesos 0,33, 0,48, -1,04? Utilizei um software estatístico chamado R e o alimentei com dados do Campeonato Brasileiro de 2016. Através de um procedimento de otimização, o software encontra os melhores valores para os pesos de acordo com alguns critérios.


Para determinarmos a probabilidade de empate, basta utilizar o mesmo procedimento, considerando como resultado de interesse o empate. E para a probabilidade de vitória do outro time, basta tomar as duas probabilidades já calculadas e diminuir de 100%.


É claro que esse é um modelo muito simples. Muitas outras informações podem ser incorporadas. Mas o raciocínio é esse. Se alimentarmos o software com informações do valor de mercado dos times, por exemplo, ele irá encontrar o peso para essa informação para considerá-lo no modelo.


Esse é um típico modelo do que chamamos de machine learning, ou aprendizagem de máquina, pois alimentamos a máquina (computador) com dados e ele "aprende" a melhor maneira de considerá-los para o cálculo das probabilidades.


Há outros modelos mais complexos, que consideram uma série de aplicações da função logística ou mesmo outras funções. São as chamadas redes neurais, muito utilizadas principalmente para cálculo de cotações em casas de apostas. Há modelos que tentam prever o número de gols de cada time. Enfim, há uma miríade de possibilidades.


Mas uma das bases é esse modelo de regressão logística. Se você o entende, já tem um bom fundamento para calcular probabilidades de resultados de jogos de futebol de uma forma bem interessante.


Acesse o canal do Esportístico no YouTube para saber mais detalhes a respeito do método.





2,285 visualizações1 comentário

Entre em contato

Caso tenha dúvidas, críticas, sugestões ou simplesmente queira entrar em contato, preencha o formulário e clique em "Enviar".
  • LinkedIn Social Icon
  • Facebook Social Icon
  • Instagram
  • Twitter Social Icon
  • YouTube

© 2019 por Daniel Takata.