[Análisis] Rendimiento en la primera vuelta de la Premier League con los xG

Hoy vuelve la Premier League después de un fin de semana copero y, salvo algún partido aplazado todavía pendiente, los equipos ya han jugado todos sus encuentros de la primera vuelta.

Vamos a aprovechar a analizar como les ha ido a cada uno de ellos y, como siempre, nos apoyaremos en datos y usaremos R para visualizarlos de distintas formas.

Resumen

Objetivo: Analizaremos si, utilizando la métrica xG, podemos ver si hay conjuntos que están rindiendo por encima de lo esperado o, por el contrario, si hay otros que no están cumpliendo con las expectativas.

Fuente de datos: Los datos de xG por equipo los vamos a extraer de FotMob y los guardaremos en un archivo en formato CSV. Utilizaremos los datos individuales de todos los partidos para ver su distribución por equipo y diferencias, y luego los agregaremos para sacar totales y medianas.

Lenguaje de programación: R. Para crear los gráficos de densidad y de puntos hemos utilizado ggplot2 y, para nuestras tablas, los paquetes gtgtExtras y Paletteer. Además, esta vez hemos querido experimentar con patchwork para incluir varios gráficos en la misma visualización.

Análisis

Lo primero que debemos hacer es echar un vistazo a la clasificación para situarnos:

Imagen de Google

Como ya sabemos, el Arsenal está intratable este año, el Newcastle se ha colado entre los grandes y el Liverpool o el Chelsea están de capa caída. Por abajo, tenemos hasta ocho equipos en cuatro puntos, entre ellos, equipos no esperados como el West Ham o Leicester City. La grata sorpresa la están dando el Fulham o el Brentford que, sorpresivamente, pelean por puestos europeos.

Más allá de lo que nos ofrece la clasificación, nos vamos a centrar en los xG. Para ser más exactos, vamos a ver la GD-xGD, es decir, la diferencia entre la diferencia de goles y la diferencia de xG. Esto nos puede ayudar a ver que equipos están rindiendo por encima o por debajo de lo esperado.

Empecemos por la distribución de GD-xGD por partido de cada equipo. Los equipos están ordenados por la mediana de GD-xGD:

Es sorprendente ver al Fulham en tercera posición o al West Ham tan hundido. Son un claro ejemplo de un equipo que está rindiendo muy por encima de sus posibilidades y otro que lo está haciendo muy por debajo. Otro caso preocupante podría ser el del Chelsea que, a pesar de estar cuarto en mediana de GD-xGD, en la clasificación general va décimo, muy alejado de los puestos de cabeza. Esto nos hace pensar que va mal, pero que podría ir incluso peor.

Veámoslo más en detalle, también en medianas:

El “colista” (West Ham), claramente tiene un problema de gol, ya que en gran parte se sitúa último de esta clasificación por los GF-xGF. Esto nos hace pensar que, a nada que sus delanteros empiecen a acertar, debería subir en la clasificación. En este club de “fallones” también podríamos incluir al Everton o al Nottingham Forest, que también se encuentran en la pelea por la salvación.

El Fulham destaca tanto en GF-xGF como en GC-xGC. Lo segundo es en gran medida al buen hacer de Bernd Leno, que marca un -5,4 en GC-xGOT, sólo mejorado por Alisson.

Otro aspecto interesante a analizar es ver que “suerte” han tenido los equipos en los partidos que la xGD ha estado igualada (1 > xGD > -1):

El equipo de Craven Cottage se pone en cabeza con siete de nueve partidos ganados cuando la xGD ha estado ajustada. Todo hace indicar que el Fulham debería bajar el ritmo en la segunda vuelta.

El West Ham también sale en esta foto y se le unen Leeds United, Everton o Leicester City, que no están teniendo la suerte de cara en los partidos igualados.

Si queréis profundizar el análisis de la métrica xGD en partidos igualados, os recomiendo este hilo de Jesús Lagos en Twitter.

Conclusiones

Como hemos visto, la métrica xG utilizada junto con los goles, ambas tanto a favor como en contra, nos puede ser muy útil para darnos una primera idea de cómo están rindiendo los equipos. Evidentemente, los xG hay que interpretarlos conociendo sus limitaciones y sólo usarlos de apoyo a otros análisis más profundos.

A modo de cierre del artículo os dejo esta visualización que combina varias de las gráficas y tablas utilizadas anteriormente utilizando el paquete patchwork:

Espero que os haya gustado y recordad que, como siempre, podéis encontrar todo el código en nuestra cuenta de GitHub y comentar el artículo en este hilo de Twitter.