"Now then, Dmitri, you know how we've always talked about the possibility of something going wrong with the Bomb..."
- President Merkin Muffley, Dr. Strangelove or: How I Learned to Stop Worrying and Love the Bomb
O Brasileirão deste ano vem levantando diversas discussões sobre a influência da posse de bola na probabilidade de vitória. Circulam matérias afirmando que: quem tem maior posse de bola não costuma sair com a vitória. Há várias matérias sobre isso, veja aqui, aqui, e aqui. Segundo Guilherme Marçal, que escreve para a coluna “Espião Estatístico” do Globoesporte.com, em apenas 24,3% das partidas, o clube com mais posse de bola saiu vencedor (veja aqui).
Essas conclusões são bastante intrigantes, contudo times com menor posse de bola levando vantagem no Brasileirão não é uma novidade. Veja a coluna “Não queremos a bola” de Mauro Cézar Pereira, no portal da ESPN. Os dados apresentados por Mauro mostram que isso ocorre desde 2013.
Contudo, Renato Rodrigues, do DataESPN, em uma coluna recente (leia aqui), levanta um ponto que é primordial nessa discussão: o que é a posse de bola? Qual a definição de posse de bola? Como são contados os minutos que a bola não está em jogo? Esses números de posse de bola levam em consideração momentos em que a bola está parada esperando a cobrança de uma falta, pênalti ou escanteio? O problema com a estatística “posse de bola” é que não sabemos a definição exata de como essa posse é calculada. Quando assistimos a transmissão de um jogo pela TV, em nenhum momento você escuta um comentarista definir a variável “posse de bola”; esse número surge na tela como se sua definição fosse tão clara quanto a definição de número de finalizações, faltas ou passes errados. Mas este não é o caso.
Para mostrar a importância de se definir como se calcula a posse de bola, eu busquei os dados de posse de bola, referente as três primeiras rodadas do Brasileirão 2017, de quatro fontes distintas, são elas: 1) o site whoscored.com; 2) a plataforma Footstat; e dos sites de apostas; 3) futebol.com e 4) academiadasapostasbrasil.com. Os resultados estão na tabela abaixo. Na maioria dos casos, os percentuais de posse de bola diferem. Cada site fornece um percentual diferente. As diferenças variam entre 1 e 17 pontos percentuais! Isso mesmo, as diferenças de posse de bola, para uma mesma partida podem chegar as 17%. A diferença média é de 7 pontos percentuais em cada partida. Além disso, em apenas 56,7% dos casos, todos os sites concordam sobre qual a equipe que terminou a partida com mais posse de bola! Por exemplo, Palmeiras 4x1 Vasco, pela primeira rodada do Brasileirão; neste jogo, whoscored.com, Footstat e Academia concordam que o Palmeiras terminou a partida com mais posse de bola (51,3%, 51 e 55%, respectivamente). Porém, o site de apostas Fotebol.com mostra o Vasco com 52% de posse de bola. Há vários outros exemplos, confira na Tabela 1.
Todos esses sites fornecem as estatísticas de posse de bola, porém, em nenhum deles há uma definição clara de como essa estatística é calculada. Provavelmente esses sites possuem diferentes definições de posse de bola, e por isso existem divergências nos valores da Tabela 1. Além do mais, essas definições não são claras, não há explicações nos respectivos sites. Não sabemos o que está por trás destes números. Em resumo, a posse de bola é uma caixa-preta.
Se queremos entender a posse de bola no futebol, primeiro é preciso ter uma definição clara de como é calculada essa estatística. Depois, é preciso entender como analisar essa estatística.
Tendo isso em mente, eu calculei a posse de bola para todos os jogos do Brasileirão, até a rodada 25. Construí a estatística de posse de bola com a seguinte definição: são contados apenas os momentos em que a bola está em campo e o jogo não está parado. Momentos em que equipes ainda se preparam para um lateral, um escanteio, tiro de meta, ou mesmo o atendimento de um atleta lesionado, não são computados como posse de bola para nenhum clube. Períodos nos quais a bola está viajando após a marcação de um impedimento, também não são computados. Bolas que são afastadas pela defesa, ou chutadas para longe sem intenção de passe (eventos definidos pela Opta como Clearance) não são computados até que o jogador de alguma das equipes toque na bola novamente.
Bom, partindo desta definição de posse de bola, verifiquei a frequência de vitórias dos clubes com maior posse de bola. O resultado é que em apenas 26% das partidas, o vencedor foi a equipe que terminou a partida com maior posse de bola. Ou seja, minhas estatísticas de posse de bola corroboram a evidência sugerida pelas diversas matérias citadas acima. À primeira vista, parece que os números nos dizem que maior posse de bola está associada a menor número de gols.
Então quer dizer que menor posse de bola está associada com maior número de gols? Significa que os clubes brasileiros não sabem o que fazer com a bola? Como podemos entender esses dados?
Bom, para responder essas questões é preciso saber como analisar essa estatística. A primeira coisa é discernir onde a posse está concentrada; posse de bola no campo defensivo provavelmente não ajuda o time a fazer gols. A segunda coisa que devemos considerar, a qual eu acho a mais importante - e a qual vou focar neste post - é: o gol muda o jogo! Um gol muda o jogo em diversos aspectos; um deles é que clubes que marcam um gol, ficando à frente no placar, tendem a “entregar” a bola para o adversário. Várias vezes assistimos a uma partida bastante equilibrada até que um dos times marca um gol e, logo que a partida reinicia, o clube que está atrás no placar passa então a dominar a posse de bola e a fazer pressão no time à frente do placar. Isso é bastante comum. Por que? Bom, existem muitas explicações táticas e psicológicas para isso, mas o fato é que o gol marcado mudou o jogo. No mundo da análise de dados esportivos, esse conceito é chamado “game state”, ou em português, “estado do jogo” (tradução livre). Esse conceito não é algo novo, é bastante utilizado nas análises de dados do futebol, veja aqui.
Como é definido o game state? Bom, a figura abaixo explica como definimos essa variável. Suponhamos que o jogo está empatado, team A 0x0 team B. Então ambos são avaliados como estando no game state 0. No momento em que o team A marca um gol, o placar passa a ser team A 1x0 team B, portanto, o team A passou para o game state 1 e o team B passou para o game state -1. Se após alguns minutos, o team B marca um gol, então o placar se torna team A 1x1 team B. Sendo assim, ambos são avaliados, novamente, como estando no game state 0. Ou seja, o game state é a diferença de gols que cada time se depara em cada momento da partida. A Figura 2 esclarece como são computados os game states durante uma partida.
O game state é importante para avaliarmos a posse de bola se os clubes tendem a “ceder” a posse de bola à medida que passam à frente no placar. Portanto, se isso é verdade, é importante analisar a posse de bola em cada segmento de tempo definido pelos game states (o que é chamado de segment length na Figura 2). Bom, o senso comum nos diz que isso é verdade, mas será que isso é verdade nos dados? Sim. A Tabela 2 mostra a correlação entre game state e posse de bola para 4 competições (Brasileirão, Inglês, Espanhol e Alemão) ente 2013 e 2017. Para chegar a essas correlações, eu calculei os game states de cada partida para campeonato. Cada jogo foi dividido em game states de acordo com a ocorrência de gols. Isso foi feito para todos os jogos. A partir disso, eu calculei a posse de bola de cada equipe durante cada game state, ou seja, a posse de bola durante o segment length (veja Figura 2). A posse de bola foi calculada de acordo com a definição dada anteriormente (é contado apenas o tempo em que a bola está em campo e o jogo não está parado). Com essa base de dados podemos verificar a relação linear entre a posse de bola e o placar (game states) de cada partida.
As correlações são negativas em todas as ligas e para todos os anos analisados. Ou seja, clubes que estão à frente no placar estão associados com menor posse de bola durante aquele game state. Quanto mais à frente um clube está no placar (em número de gols), MAIOR é seu game state e, ao mesmo tempo, MENOR é sua posse de bola. Portanto, os dados mostram que quando um clube passa à frente no placar, ele tende a “entregar” a bola para a equipe adversária. Isso é verdade no Brasil, na Inglaterra, na Espanha e na Alemanha, ou seja, nas principais ligas. Os coeficientes de correlação são mais negativos para os campeonatos brasileiros do que para os europeus, isso significa que essa “entrega” de bola para a equipe adversária, ocorre com mais frequência no Brasil.
Flamengo 0x1 Grêmio, pela décima terceira rodada do Brasileirão deste ano, é um bom exemplo. Apesar vitória do clube gaúcho, com gol de Luan aos 26 minutos da primeira etapa, o Flamengo terminou a partida com 58% de posse de bola. No entanto, dividindo a partida por game states, temos que até o gol do Grêmio, aos 26 minutos do primeiro tempo, a equipe gaúcha tinha 52% da posse de bola. O Grêmio tinha uma posse de bola levemente superior ao Flamengo até o momento em que marcou o gol. Entre o gol do Grêmio e o final da partida, o Flamengo passou a manter 62,1% da posse de bola (fazendo a média ponderada entre os dois game states ficar nos 58% de posse de bola descritos acima). Portanto, se olharmos apenas para a posse de bola no final da partida, cometeríamos o erro de afirmar que o Grêmio, mesmo com menor posse de bola, marcou um gol no Flamengo. Na realidade, o Grêmio marcou o gol em um momento em que tinha maior posse de bola que o Flamengo. Depois de fazer o gol, o Grêmio “entregou” a bola para o Flamengo, que não conseguiu marcar (para a sorte/competência do clube gaúcho).
Se a equipe vencedora terminou a partida com menor posse de bola, não podemos afirmar que o conceito de jogo de Pep Guardiola está errado, ou que os dados estão refutando o conceito de jogo do técnico catalão. O que pode estar ocorrendo é que as equipes vencedoras possuem maior posse de bola até o momento que marcam o gol que decide a partida, depois disso, elas “entregam” a bola ao adversário e passam a se defender. Isso faz com que, no final da partida, a equipe vencedora apresente menor posse de bola, mas ela pode ter tido maior posse enquanto o jogo estava empatado. Se for este o caso, fica claro que ter maior posse de bola está associado positivamente com a marcação de gols; porém, se olharmos apenas a posse de bola ao final da partida não conseguiremos enxergar isso. Portanto, se não considerarmos a posse de bola condicional ao game state, podemos concluir, erroneamente, que ter menos posse de bola é mais efetivo para marcar gols; quando na realidade o que está ocorrendo é exatamente o contrário.
Para o Brasileirão deste ano (até a rodada 25), temos que em 58% das vezes em que uma equipe desempatou a partida, ela possuía maior posse de bola até o momento do gol. Ou seja, na maioria das vezes em que uma equipe passou à frente no placar, ela possuía mais posse de bola até o momento em que o gol foi marcado. O mesmo ocorre em todo os campeonatos europeus, porém, na Europa essa frequência é maior do que no Brasil (no inglês 16/17, por exemplo, cerca de 60% das vezes em que uma equipe desempatou a partida, ela possuía maior posse de bola).
Portanto, maior posse de bola está associada com mais gols marcados. Então, o que temos não é o efeito descrito pela Figura 1, e sim, os efeitos descritos pela Figura 3, logo abaixo.
Existem dois efeitos: 1) mais posse de bola aumenta as chances de marcar um gol (efeito positivo), porém, após marcar um gol; 2) a equipe diminui sua posse de bola (efeito negativo). A simples correlação entre posse de bola ao final da partida e número de gols, nos mostra o resultado líquido desses dois efeitos, que é negativo. Porém, o que nos interessa é avaliar o efeito de posse de bola no número de gols (queremos mensurar o efeito da flecha da direita na Figura 3). Quando controlamos para game state, vemos que na realidade, maior posse de bola está associada a um maior número de gols. Portanto, o Brasileirão deste ano não está derrubando a tese de Pep Guardiola, ao contrário, está confirmando.
A título de curiosidade, vamos analisar as partidas do Corinthians. Das 16 vitórias do Corinthians até agora (rodada 25), em apenas 6 delas o Corinthians terminou com maior posse de bola do que o adversário, ou seja, apenas em 37,5% das vezes em que saiu vencedor, terminou a partida com maior posse de bola. Contudo, dos 35 gols marcados pelo Corinthians até aqui, em 52% das vezes, o Corinthians teve maior posse de bola no game state que antecedeu o gol. Ou seja, na maioria das vezes em que o Corinthians marcou um gol, ele possuía mais posse de bola, até aquele momento, do que o adversário. Portanto, o Corinthians não é um time que “ganha entregando a bola ao adversário”, ao contrário, a maioria dos gols do Corinthians acontece em momentos da partida em que o time paulista tem maior posse de bola que o adversário. Porém, após marcar o gol, ele entrega a bola ao adversário e consegue aguentar a pressão adversária sem levar gol.
Outro exemplo. Das 13 vitórias do Grêmio até a rodada 25, em apenas 6 delas o tricolor gaúcho terminou com maior posse de bola que o adversário; ou seja, 46% das vezes. Porém, dos 40 gols marcados até aqui, 55% deles foram marcados quando o Grêmio possuía maior posse de bola no game state anterior ao gol (ou seja, até o momento em que o gol foi marcado).
Esses números dão uma leitura diferente do usual. O futebol é um jogo dinâmico, portanto é importante avaliar algumas estatísticas, como a posse de bola, condicional ao placar da partida em cada momento do jogo. O problema em olhar apenas a posse de bola ao final da partida é que iremos observar o efeito líquido de dois efeitos de sinais opostos: MAIOR posse de bola gera MAIS gols (efeito positivo); e MAIS gols gera MENOR posse de bola (efeito negativo). Contudo, estamos interessados, na maioria dos casos, apenas no efeito positivo. Condicionar a posse de bola ao placar da partida é importante, porém as análises feitas até agora não estão levando isso em consideração.
Em resumo, neste post foi definido um conceito bastante claro para uma estatística de posse de bola. Mostrei que diferentes sites utilizam diferentes definições de posse de bola, e que essas definições carecem de explicação. Mostrei que os clubes que ganham as partidas geralmente terminam a partida com menor posse de bola. A princípio esse resultado sugere que gols marcados estão associados à menor posse de bola. Porém, devemos analisar a posse de bola condicional ao game state (estado do jogo)! Quando condicionamos a posse de bola ao game state, vemos que os clubes marcam a maioria dos seus gols quando possuem mais posse de bola até o momento do gol marcado. Portanto, quando analisamos a posse de bola, devemos olhar para a posse condicional ao placar da partida (e não apenas olhar para a posse de bola no final da partida). O Corinthians marcou a maioria dos seus gols enquanto tinha maior posse de bola do que seus adversários. O mesmo se deu com o Grêmio.
Por último, os números deste brasileirão trazem evidências a favor da tese de Pep Guardiola; no futebol, vence quem tem a bola nos pés.