Ante la afirmación de que el pitcheo es el 75% del juego de pelota, la respuesta típica, por lo menos hace diez años, hubiera sido asentir y no cuestionar. Sin embargo viendo el juego de forma objetiva, hoy nos atrevemos a emprender un análisis pormenorizado que permita aislar cada factor que influye en la producción y prevención de carreras y por ende en el logro de victorias. Dedicamos este análisis a José Armando Acta, quien con el ejercicio inicial realizado, me motivó la semana pasada a analizar el tema en Deportes en la Z para luego profundizar metido en los datos. Para esto presentamos dos enfoques: uno basado en el WAR y otro aplicando una Regresión.
PRIMER ENFOQUE: WAR. Para el primer análisis se utilizó el WAR o Victorias sobre el nivel de reemplazo. Se tomaron las carreras creadas por los bateadores, carreras prevenidas por defensa y por lanzadores (abridores y relevistas), las convertiremos a WAR, y así ver qué %significa cada una para con las victorias totales.
SEGUNDO ENFOQUE. Aquí tomamos varias estadísticas relacionadas con la creación y prevención de carreras para medir con una regresión como impactan la cantidad de victorias:
- Carreras permitidas por defensa jugadores de posición. Se calculó: Carreras Permitidas totales menos Carreras permitidas por lanzadores según FIP (RA-D-FIP)
- Carreras permitidas por Lanzadores según FIP (RA-FIP). Dichas carreras fueron segregadas entre abridores (RA-FIP-SP) y relevistas (RA-FIP-RP).
- Carreras anotadas (RS)
- En uno de los modelos se utilizaron las carreras prevenidas por la defensa, según el UZR (Ultimate Zone Rating), en lugar de la RA-D-FIP.
Los datos utilizados fueron los totales agrupados de todos los equipos de Grandes Ligas, desde el año 2000 al 2011. Esto suma unas 360 observaciones. Para las pruebas utilizaremos un nivel de confianza de 95%, por lo que sólo aceptaremos como válidas las variables que presenten un P (P-Value) menor a 5% (0.05).
El primer modelo, nos muestra un buen ajuste, donde las variables incluidas explican 90% de las victorias logradas. Yendo sobre la pregunta que buscamos responder, el factor de mayor peso resultó ser el Relevo con un peso de 37.6%, mientras que la Ofensiva aporta 22.3%, el Pitcheo abridor 22.2%, y las carreras prevenidas por la defensa 17.8%. Si lo vemos agrupado, esto implica que el pitcheo en total representa 59.9%, y si lo sumamos a la defensa, el aspecto prevención de carreras llega a 77.7%.
---------------------------------------
El segundo modelo, incorpora las carreras permitidas por la defensa (las del UZR son carreras prevenidas), calculadas según se explicó arriba. Es importante señalar que este indicador fue calculado por quien escribe para la ocasión a partir del FIP provisto por FanGraphs, por lo que no encontrarán el mismo en otras páginas por el momento. Este modelo logró proyectar mucho mejor (90.1% vs. 93.9%), redujo el error promedio en un triunfo (5.06 vs 3.99) y aumentó el nivel de confianza de las variables utilizadas. Entendemos que una de las razones del buen ajuste de este modelo es que el mismo se trata prácticamente de una descomposición del RunDifferential )diferencia entre carreras anotadas y permitidas), que es la métrica de mejor correlación con las victorias (93.8%). Por lo tanto nos quedaremos con este modelo como el de mayor precisión.
Así vemos que de nuevo sale el pitcheo de Relevo como el factor de mayor ponderación con 28.1%, pero ahora está más cerca el pitcheo Abridor con 25.2%; el Bateo representa 23.95% y las Defensa 22.8%. Este último modelo indica un enfoque muy balanceado para ganar un juego de pelota con cada aspecto representando casi lo mismo (1/4) para lograr este resultado, sobresaliendo la prevención de carreras como el aspecto principal para con 76%.
Vistos estos resultados, podemos concluir que el pitcheo realmente es la parte más importante del juego, pero no con tan amplio margen, sino representando 53.3%. Los jugadores de posición siguen siendo muy importantes pues el 46.7% restante es aportado fundamentalmente por ellos.
Cerramos proponiendo un nuevo dicho: La prevención de carreras es el 76% del juego… Si queremos redondearlo y que suene más a pueblo: Evitar que anoten es el 75% del juego!
Fuentes: www.fangraphs.com | www.baseball-prospectus.com
Glosario. FIP: Fielding Independent Pitching, es calcular la proporción de carreras permitidas de un lanzador, excluyendo el soporte de la defensa. Intercept: Intercepto, o valor teórico que toma la variable explicada en el modelo (en este caso las victorias), cuando todas las demás son iguales a cero. Intervalo de Confianza: rango o “margen” en el que se proyecta el comportamiento de una variable; teniendo un límite superior y uno inferior. Li: Límite inferior. LS: Límite Superior. Por ejemplo: por cada carrera anotada (RS) las victorias aumentan en promedio 0.098, pero el impacto podría andar entre 0.093 y 0.103 en un 95% de los casos.
espero mas publicaciones y analisis sabermetricos siempre me he preguntado porque los jugadores pequeños no son apetecidos en mlb, hay alguna metrica que los descalifique
ResponderEliminarGracias por seguir el blog. Comenzaré a subir nuevo material esta semana. Desconozco algún análisis relacionando tamaño y desempeño; te prometo investigar. Haciendo un análisis a priori, creo que algo a considerar es el nivel de habilidad y esfuerzo demandado por cada posición. Por ejemplo, las posiciones donde recuerdo mayor número de jugadores con estaturas entre 5'6" y 5'8", y con poca masa muscular, priorizan la defensa, por lo que agilidad y desplazamiento rápido en distancias cortas son claves, receptor (C), campo-corto (SS) o intermedista (2B). Si consideramos que hay limitaciones para ser lanzadores, que en las esquinas buscan poder, y que los jardineros tienden a ser más latos, las posiciones mencionadas representan 33% de los titulares y alrededor de 20-24% del roster completo, vemos que alguien de baja estatura tiene menos alternativas para estar en el roster.
ResponderEliminar