Opinión

Tiempo de elección: evaluación de resultados

En octubre de este año presentamos en el blog el modelo “Tiempo de elección”, basado en el exitoso “Time for Change” usado en las elecciones presidenciales de los Estados Unidos, con el que pretendíamos estimar el porcentaje de votos del partido en el gobierno en las elecciones generales que tendría lugar un mes después en España. Modelo que se amplió una semana después para estimar el número de escaños y el ganador. A pesar de las claras diferencias que existen entre el sistema electoral estadounidense y el español, nos parecía interesante el ejercicio para comprobar los resultados que se pueden obtener con un modelo sencillo como este. En esta entrada vamos a comparar las predicciones del modelo con los resultados reales.

Comparación de los resultados

En primer lugar, podemos comparar las predicciones del modelo con los resultados reales en las elecciones para el partido en el gobierno. Valores que se pueden ver en la siguiente tabla.

Tiempo de elecciónResultados eleccionesError
Porcentaje de votos34,42%28,00%6,40%
Escaños14112021
GanadorVerdaderoVerdadero

Lo primero que se puede notar es que el error obtenido es bastante alto, un 6,4% en el porcentaje de votos y 21 en el número de escaños. Cuando en el conjunto de entrenamiento el error medio fue de 2,1% y 5 escaños. Se puede recordar que el error máximo que se había observado en los datos de entrenamiento fue en las elecciones de 2008 con unos errores de 4,6% y 10 escaños. Lo que indica que los resultados son malos, con un modelo que posiblemente esté sobreajustado por la falta de datos.

Aunque se puede indicar que el error obtenido es similar al macrobarómetor de octubre del CIS. En este se estimaba un porcentaje de votos del 32,2% y un número de escaños entre 133 y 150.

¿Por qué no funciona “Tiempo de elección” como “Time for Change”?

Una buena pregunta es ¿por qué los resultados de “Tiempo de elección” no son tan buenos como los de “Time for Change”? Posiblemente la primera causa sea la falta de datos. En el caso de “Tiempo de elección” la evaluación de los políticos solamente se encuentra disponible desde las elecciones de año 2000, lo que nos deja poco más de una década para entrenar el modelo. En el caso del “Time for Change” el modelo se puede entrenar con datos desde 1948, es decir ocho décadas de información.

Otra diferencia puede estar en la diferencia de las series utilizadas. En el modelo “Time for Change” se emplea la aprobación del presidente. Lo que es un buen indicador de lo que se desea predecir. En nuestro caso ante la falta de un valor equivalente, se utilizó el indicador de expectativas políticas. Algo que posiblemente no sea un predictor tan bueno.

Además, se encuentra la diferencia en los sistemas electorales. En España no se elige un presidente, sino que los diputados. Los cuales posteriormente eligen al presidente. Esto ofrece a los electores más opciones, no solamente los candidatos de los partidos mayoritarios.

Otro punto para considerar es el hecho de que las elecciones son una repetición de las realizadas medio año antes. Con un posible cansancio de los electores. Por lo que la situación política no era similar a la que se tenía en los datos de entrenamiento. Donde las elecciones se repiten aproximadamente cada cuatro años.

Posibles mejoras

De cara a un futuro modelo se pueden plantear varias mejoras. En primer lugar, se pueden buscar otras series temporales que puedan ser más significativas para el caso español.

Otra mejora puede se acortar el tiempo entre los datos usados en el modelo y las elecciones. Al usar los datos seis meses antes de las elecciones puede que los valores no sean representativos. Posiblemente bajar el tiempo a tres meses pueda ser más efectivo. En este aspecto se puede tener en cuenta que las elecciones en España no son siempre en el mismo momento del año, como si es en Estados Unidos. Por lo que acercar las series puede se más importante.

Finalmente, se puede plantear la búsqueda de un indicador que mida la polarización en la población de cara a mejorar las predicciones.

Conclusiones

En esta entrada se ha intentado explicar los resultados obtenidos por el modelo “Tiempo de elección” en las elecciones generales que tuvieron lugar en España en noviembre de 2019. Con lo que además se han propuesto mejorar de cara a aplicar el modelo en futuras elecciones.

Imágenes: Unsplash (Arnaud Jaegers)

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez
Tags: Elecciones

Recent Posts

Curiosidad: La Paradoja de Simpson, o por qué no siempre debes fiarte de los promedios

En ciencia de datos y estadística, los promedios y porcentajes son herramientas fundamentales para resumir…

20 horas ago

Copias de seguridad automáticas en SQL Server con rotación de archivos

Las bases de datos son el corazón de casi cualquier sistema de información moderno. Ya…

3 días ago

Curiosidad: La Ley de Twyman y la trampa de los datos “interesantes”

En ciencia de datos, pocas cosas llaman más la atención de los científicos de datos…

1 semana ago

Cómo calcular el tamaño de la muestra para encuestas

Calcular adecuadamente el tamaño de la muestra es una parte esencial en el diseño de…

1 semana ago

Curiosidad: El origen del análisis exploratorio de datos y el papel de John Tukey

Hoy en día, cuando pensamos en ciencia de datos, lo primero que nos viene a…

2 semanas ago

Cómo extender el tamaño de un disco en Rocky Linux 9 usando growpart y LVM

Ampliar el espacio de almacenamiento en un sistema Linux es una tarea habitual y crítica…

2 semanas ago

This website uses cookies.