Se ha pedido a los españoles que voten en una elección nacional anticipada que tendrá lugar el próximo domingo. La elección concluyó el lunes con expectativas mixtas. Algunos ven a la derecha como una clara mayoría, otros le dan una pequeña mayoría y algunos piensan que es más probable un gobierno de izquierda. Teniendo en cuenta todos estos datos y el error normal de las encuestas, ¿cuáles son las probabilidades de cada evento? Esta es la pregunta que responde nuestro modelo electoral probabilístico clásico, que EL PAÍS viene publicando desde 2016.
El siguiente gráfico representa nuestra estimación de asientos basada en el promedio de las encuestas. El conservador Partido Popular (PP) tendrá alrededor de 142 escaños, seguido del Partido Socialista (PSOE) con 108 escaños, el ultraderechista Vox con 35 y el izquierdista Sumar con 34. El resto de las fuerzas políticas obtendrán unos 31 escaños en total.
Para realizar esta estimación utilizamos un modelo estadístico y simulamos elecciones 15.000 veces, tal como se describe en la metodología al final del artículo. El modelo se alimenta de encuestas e incluye un dato fundamental: su veracidad histórica.
En España, las encuestas suelen desviarse del resultado en unos dos puntos por partido de media, y no es raro que se equivoquen en tres o más puntos entre sí. En otras palabras: nuestros rangos son amplios pero no volátiles, ya que representan la precisión de encuestas anteriores.
Es fácil ver la incertidumbre que aún rodea esta elección. Por ejemplo, según nuestros cálculos, el resultado más probable para el PP sería de alrededor de 142 escaños, pero el rango de probabilidad del 90 % es de 119 a 164 escaños. Y todavía hay una probabilidad de 1 en 20 de que termine con un PP por encima (o por debajo) de este amplio rango.
La clave: quién ganará la mayoría
La principal ventaja de tener un modelo de predicción es que nos permite atribuir probabilidades a diferentes resultados, algo que las encuestas por sí solas no pueden hacer. Esto permite abordar la cuestión fundamental de las elecciones generales: ¿Qué partidos tienen posibilidades de ganar los 176 escaños necesarios para la mayoría? El cuadro resumen muestra:
- El 55% de las veces PP y Vox sumarán la mayoría. En 15.000 simulacros, esta es la frecuencia con la que los dos partidos alcanzan los 176 escaños que necesitan. La mayoría unilateral de PP solo se presenta en 1 de cada 100 ocasiones (1%). En otro 5% de simulacros podría haber un gobierno del PP, que además de contar con el apoyo de Vox en una votación inaugural, el partido también contó con el apoyo de Coalición Canaria, Unión del Pueblo Navarro y Teruel Existe.
- En otro 15% de las simulaciones (1 de cada 7), es probable que haya una mayoría de izquierda, si el PS consigue el apoyo de los mismos partidos que votaron a favor o se abstuvieron cuando Pedro Sánchez fue confirmado como nuevo presidente del Gobierno por el Parlamento tras las elecciones de 2019: BNG, PNV, ERC y Bildu, además de Sumar. Luego están las probabilidades del 1% de que PSOE y Sumar alcancen la mayoría por su cuenta.
- En el 23% restante de las simulaciones, no se puede realizar ninguna de las sumas anteriores. Son escenarios en los que el PSOE también necesitaría el apoyo de los partidos independentistas catalanes Junts, CUP, o ambos para pasar de los 176 escaños (20% de las veces). Pero también se incluyeron los empates en los 175 escaños entre ese grupo (PSOE, Sumar, BNG, PNV, ERC, Bildu, Junts y CUP) y los formados por PP, Vox, UPN, CC y Teruel Existe (3%).
¿Qué significa este dato? Los números anteriores son probabilidades: las probabilidades de que cada mayoría sea probable que ocurra. Dicen que la mayoría de PP y Vox es el resultado más probable, aunque sucede la mitad de las veces. En cierto modo, estas previsiones son un aviso de posibles sorpresas. Otra forma de verlo es imaginar un árbol de alternativas. De cada 100 futuros posibles, los números en la parte superior muestran cuántas veces gana la derecha y cuántas veces gana la izquierda. Lo que no sabemos es cuál de esos contratos será nuestro futuro.
15.000 simulaciones por partido
El siguiente gráfico muestra la distribución de escaños para cada partido en nuestras 15.000 simulaciones. Primero nos fijamos en los Cuatro Grandes. Además de notar que la incertidumbre es grande, es interesante ver que las distribuciones son asimétricas, debido a la influencia del sistema electoral. Por ejemplo, será más fácil que Sumar y Vox se hagan más pequeños que crezcan. Con el Partido Socialista de los Trabajadores sucede lo contrario, porque si crece lo suficiente amenazará el primer lugar del Partido Popular en muchas provincias.
Finalmente, estas son las distribuciones de escaños para los partidos menores.
metodología
Los pronósticos se producen a través de un modelo estadístico basado en encuestas y su precisión histórica. El modelo es similar al que usamos para las elecciones de abril y noviembre de 2019, en México, Francia y Reino Unido, y en las elecciones autonómicas españolas en Andalucía, Cataluña o Madrid. Funciona en cuatro pasos: 1) compilar y promediar las encuestas, 2) proyectar el promedio de cada condado, 3) incorporar la incertidumbre proyectada y 4) simular 15,000 elecciones para asignar escaños y calcular probabilidades.
Paso 1. Promediar las encuestas. Nuestro promedio tiene en cuenta las puntuaciones de las encuestas para mejorar su precisión. El promedio se pondera para dar un peso diferente a cada encuesta de acuerdo con tres factores: tamaño de la muestra, empresa de la encuesta y fecha. Puede leer los detalles aquí.
Paso 2. Ver el voto de cada provincia. Antes de calcular los escaños, es necesario estimar la proporción de votos de cada partido en cada provincia. Para ello se utilizan los resultados de las elecciones de 2019 y algunos ajustes con las elecciones provinciales. Este es un método común, sencillo y que funciona razonablemente bien (si el partido crece, lógicamente crecerá donde ya era más fuerte). La mayor dificultad es encontrar los números correctos con grupos muy pequeños que pueden tener opciones de asientos, pero tenemos muy pocos datos sobre ellos.
Paso 3. Incorporar la incertidumbre en la encuesta. Este es el paso más complejo e importante. Es necesario estimar la precisión esperada de las investigaciones. ¿Qué tan grandes son los errores habituales? ¿Qué probabilidad hay de errores de 2, 3 o 5 puntos? Para responder a estas preguntas se han estudiado cientos de encuestas en España y miles a nivel internacional.
Errores esperados de calibración. Primero, las encuestas en España estaban mal calculadas. Se ha creado una base de datos para todas las elecciones desde 1986. El error absoluto medio (MAE) en los promedios de las encuestas fue de aproximadamente 2 puntos para cada partido. Esto significa que las desviaciones de 3 o 4 puntos fueron comunes y que el margen de error (95%) se acerca a los siete puntos para partidos en torno al 30% de los votos. Estos errores dependen al menos de dos cosas: el tamaño del partido y la proximidad de la elección. Para tener en cuenta estos dos factores, utilizamos la base de datos de Jennings y Wlezien, publicada en Nature. Se analizaron los errores de más de 4.100 referéndums en 241 elecciones en 19 países occidentales. Así, se construyó un modelo simple para estimar el error MAE de la votación promedio estimada en las encuestas para cada partido, teniendo en cuenta: 1) su tamaño (es más fácil estimar un partido con un 5% en la votación que uno con más del 30%), y 2) los días que faltan para la elección (porque eventualmente las encuestas mejoran).
Elige el tipo de distribución. Para incorporar la incertidumbre en el voto de cada partido en cada simulación, se utiliza una distribución multivariante. Las distribuciones Student-t se utilizan en lugar de las distribuciones normales para que tengan colas más largas (curtosis): esto aumenta la probabilidad de eventos muy extremos. Nate Silver explicó las ventajas de esta hipótesis: «Estimé el nivel de curtosis con la base de datos. Luego defino la matriz de covarianza para estas distribuciones para que la suma de los votos no supere el 100% (una idea de Chris Hanritty). La incertidumbre se combina en 53 distribuciones, una a nivel nacional y otra en cada provincia. La primera distribución presenta errores iguales en un voto de partido en toda España. Es importante hacer esto porque en general los errores en las encuestas son sistémicos y similares en todas las regiones. El modelo falla s debido al exceso de confianza. Esto sucedió con algunos modelos de elecciones estadounidenses en 2016. La segunda parte de la incertidumbre está integrada en cada condado. Finalmente, las amplitudes de las matrices de covarianza deben escalarse para que las distribuciones de votos resultantes tengan un MAE y una desviación estándar esperada de acuerdo con la calibración.
Paso 4. Simular. El último paso es ejecutar el patrón 15.000 veces. Cada iteración es una elección simulada con porcentajes de votación que varían según la distribución definida en el paso anterior. Los resultados de esta simulación permiten calcular las probabilidades que tiene cada partido de ganar un determinado número de escaños, alcanzar la mayoría, quedar primero, etc.
¿Por qué encuestas? Este formulario se basa enteramente en encuestas. Existe la percepción de que las encuestas no son confiables, pero la verdad es que los resultados de las encuestas no han sido malos en el período reciente. En los últimos cinco años ha sido muy acertado en España, aunque hay excepciones como las elecciones andaluzas de 2018. Las encuestas de opinión rara vez son perfectas, pero no hay mejor alternativa que esta..
Montse Hidalgo Pérez contribuyó a esta historia.
¿Quieres más información? Regístrese aquí en Boletín Kiko Llaneras Analiza y explica los eventos actuales con datos y gráficos.
"खाना विशेषज्ञ। जोम्बी प्रेमी। अति कफी अधिवक्ता। बियर ट्रेलब्लाजर। अप्रिय यात्रा फ्यान।"