Profundizando en el PPDA

En esta entrada de visualización vamos a ver cómo podemos sacar más información de una métrica en base a otras. Como ejemplo utilizaremos el PPDA y veremos su relación con otras variables interesantes:

Visualización final

Resumen

Tipo de gráfico: Gráfico de cuadrantes. Es un gráfico de dispersión, el cual muestra la relación entre dos variables numéricas. Además, marcamos con una línea discontinua un valor central de cada variable para delimitar los cuadrantes. En nuestro caso, las variables a relacionar son el PPDA y la presión en los dos últimos tercios del campo (tercio central y tercio de ataque). Para las dos elegiremos como valor central la mediana, ya que ambas presentan outliers.

Fuente de datos: El PPDA lo recogemos de Understat y la presión de FBRef. Estos datos pertenecen a los equipos de La Liga en la temporada 2020-2021, recién finalizada.

Lenguaje de programación: R. Para realizar la visualización hemos utilizado el paquete ggplot2. Además, para obtener los datos de Understat, usamos el paquete datapasta. Todo el código se puede encontrar en nuestro repositorio de GitHub. El resultado es el siguiente:

Visualización con ggplot 

¿Qué vemos?

A parte de la relación entre las variables PPDA y Presión en los dos últimos tercios, vemos como hemos repartido a los equipos entre cuatro grupos.

En la esquina inferior derecha hay equipos que están por encima de la mediana en el PPDA y por debajo de la mediana de la presión. Podríamos decir que estos equipos defienden en bloque más bajo que el resto y que además no ejercen casi presión a sus oponentes. Los ejemplos más claros serían el Cádiz y el Elche.

En el cuadrante superior izquierdo vemos todo lo contrario, equipos que defienden muy arriba y que presionan bastante al rival. El Celta es el máximo exponente de esto. Estaría bien además analizar en este caso el tramo de temporada en el que el equipo gallego tuvo de entrenador a Óscar y en el que estuvo Coudet, actual entrenador, ya que puede diferir bastante.

Otro caso interesante es el del Sevilla, que es el tercer equipo que menos pases permite en campo rival, pero a su vez está entre los que menos presión ejerce. Esto nos hace intuir que defienden bastante arriba pero realizan una presión más pasiva.

Gracias a este tipo de gráficos podemos ver como equipos con PPDA similar no tienen porqué defender de la misma manera. Un claro ejemplo serían el Osasuna y el Valencia.

Veámoslo con otra métrica:

Visualización con ggplot 

El DC (Deep Completed) nos indica el número de pases que filtramos al área desde una distancia de 20 metros a la portería o menos, sin contar los centros. Con respecto al PPDA, esta métrica es interesante pero a la inversa, es decir, el número de pases que dejamos filtrar al área al rival desde zonas cercanas a portería. Se conoce como ODC (Opponent Deep Completed) y la podemos encontrar también en Understat.

Si nos fijamos en el gráfico de la presión y el PPDA, podemos apreciar que el punto del FC Barcelona y el del Levante casi se superponen. Pero, ¿quiere decir esto que sus defensas son igual de intensas? Podría ser, pero viendo este último gráfico, vemos como el equipo culé permite muchos menos pases filtrados al área. Habría que hacer un estudio mucho más exhaustivo para entender el porqué, pero queda claro que su defensa no es exactamente igual.

Por último, os dejamos el enlace a un vídeo muy interesante de Planeta Data Fútbol en el que hablan sobre el PPDA, que os ayudará a interpretar mejor esta métrica.

¿Os han parecido útiles los gráficos de cuadrante? Cuéntanoslo en Twitter.

Política de Privacidad