top of page

xG explicado

Seu time chutou 15 vezes ao gol contra 2 chutes do adversário e o placar foi 1-0 para eles? Gosta de um atacante que não recebe muitas oportunidades mas quando entra fica sempre no 'quase'? Sua defesa sofre poucos gols apesar das enormes chances que o adversário cria? Muito disso pode ser explicado pelo xG - valor esperado de gols, um número que indica a probabilidade de uma finalização resultar em gol. Mas como?

O conceito é simples de entender. Tomamos como exemplo o pênalti. A penalidade máxima é a melhor chance de gol que pode existir. Apenas 11 metros separam a bola da trave e a única coisa que separa o apito da comemoração de gol é o goleiro (considerando que o jogador não chute para a lua é claro). Nosso modelo atribui para o pênalti um xG perto de 0.81. O que isso significa? Significa que um gol acontece cerca de 81% das vezes que um pênalti é marcado. Em outro exemplo prático, nosso modelo diz que uma falta alçada de longe para a marca do pênalti possui um xG de 23%. Número relativamente bom, mas bem menor que um lance como o pênalti.

Mas de onde vêm esses números? Para construir um modelo capaz de computar estes números, dados sobre as finalizações são necessários. Muitos dados. Ao contrário da Europa, não há dados disponíveis de graça sobre finalizações dos jogos do Brasileirão. Por isso, a cada rodada observamos os chutes de cada jogo do Brasileirão e coletamos informações dos mesmos. Estas informações que serão utilizadas para a construção do modelo. Existem dezenas de blogs e twitters europeus que possuem diferentes modelos de xG. O que difere um do outro são duas coisas: as informações dos chutes utilizadas no modelo e o tipo de modelo estatístico usado. Portanto, se você quiser construir um modelo de xG, você pode usar qualquer característica de uma jogada que você acha que ajude (ou prejudique) a chance de uma finalização resultar em gol. No momento, meu modelo considera:

  • Região do campo onde foi feita a finalização

  • Região do campo onde foi feito o passe para a finalização

  • Tipo de jogada (coletiva, individual, escanteio, pênalti, falta direta/indireta, rebote, lateral)

  • Se o jogador driblou antes de chutar

  • Se o jogador recebeu um passe profundo

  • Se a jogada veio de um contra ataque

  • Se o chute veio de um cruzamento/cruzamento rasteiro

  • Se o chute veio de um erro crucial da zaga

A região do campo considera essa divisão da área de ataque:

Obtendo estes dados é necessário escolher um método estatístico de predição. Existem inúmeras opções. Algoritmos de decisões em árvore, redes neurais, máquina de vetores suporte. No momento estou utilizando regressão linear bayesiana pois para mim foi a que melhor se adequou à realidade, mas mudanças são sempre bem vindas.

Pronto, aplicamos o modelo às finalizações de cada time e jogador e obtivemos o xG de cada equipe e jogador. Mas como interpretar um valor de xG? Veremos como exemplo, o jogo Flamengo 2x0 Figueirense, válido pela 26ª rodada do Brasileirão.

O gráfico acima mostra a evolução do valor esperado de gols ao longo do jogo, onde cada ponto é um gol marcado. Cada mudança no valor de xG é uma finalização e as "subidas" representam a probabilidade de cada finalização resultar em gol. Subidas bruscas, como a que aconteceu aos 30 minutos por parte do Flamengo, são finalizações de alta probabilidade de serem convertidas em gol. Não obstante, esta mesma finalização aos 30 minutos foi um pênalti perdido por Leandro Damião. Da mesma forma, o 2º gol do Flamengo (representado pelo ponto pouco depois dos 70 minutos) foi um pênalti convertido por Diego. Perceba também que um pouco depois dos 50 minutos há outra subida brusca no xG do Flamengo e isso tem uma explicação bem razoável: Réver, que perdeu um gol sem goleiro na pequena área.

O primeiro gol do Flamengo contudo, surgiu de uma jogada que, segundo nosso modelo, não havia alta probabilidade de resultar em gol:

O lançamento vem de muito longe, e esse é o principal fator que faz com que a probabilidade seja baixa. Contudo, o fato de estar de frente para o gol contribuiu para um valor razoável em seu xG. O Flamengo dominou a partida. Entenda que um xG de 4.38 não significa que o Flamengo deveria ter feito 4.38 gols, mas que a soma das probabilidades de cada um de seus chutes resulta em 4.38 gols.

É possível porém, que um time saia de campo derrotado com um xG muito superior ao adversário. Como aconteceu em Internacional 0x1 Vitória, jogo válido pela 25ª rodada do Brasileirão.

O gol do Vitória foi em uma chance claríssima de gol. Falta cobrada no segundo pau, bola escorada de cabeça para a pequena área e Kanu livre apenas colocou nas redes. 1x0 e mais 0.56 de xG na conta. Perceba que até então o Inter teve uma chance razoável de gol e duas boas chances seguidas. A partir do gol do Vitória, o desespero tomou conta do time. Muitos chutes de longe, muitos chutes sem ângulo. O Inter perdeu por não ter feito o gol quando pôde no primeiro tempo e por não ter aproveitado a pressão no segundo tempo para criar jogadas de alta probabilidade de gol. Foi para o tudo ou nada. Algum desses chutes de baixa probabilidade poderia ter entrado é claro, principalmente se o time tiver muitos chutes assim, mas não foi o caso.

Da mesma forma, podemos aplicar o modelo às finalizações tomadas de cada time e obter o xGC - valor esperado de gols contra. A diferença entre xG e xGC é o xSG (valor esperado de saldo de gols).

Acima visualizamos o xSG por jogo de cada time com a média de saldo de gols por jogo. A correlação é de 0.83. Pode-se interpretar este gráfico da seguinte forma: times acima da linha possuem real saldo de gols por jogo melhor do que o esperado, times abaixo da linha possuem real saldo de gols pior do que o esperado. Assim é possível projetar uma melhora ou piora de alguns times ao longo do campeonato e portanto, prever possíveis posições para cada equipe. Mas isso é assunto para outro post...

Sobre

Inspirados em livros como Soccermatics de David Sumpter e Moneyball de Michael Lewis, decidimos utilizar conhecimentos em data science para traduzir em números o maior espetáculo que temos em solo brasileiro.​

  • Facebook - White Circle
  • Twitter - White Circle
bottom of page