Seguimiento electoral Edomex: ¿cómo le fue a nuestro modelo de voto?

El pasado 4 de junio se realizaron las elecciones para gobernadora en el Estado de México. Para finalizar nuestro seguimiento de este proceso electoral, en esta nota comparamos los resultados de nuestra última estimación de las preferencias electorales —tanto a nivel estatal y municipal— con los resultados de la elección. En resumen, encontramos que nuestra proyección reportó una muy alta precisión respecto de los resultados de la elección, tanto a nivel estatal como municipal. En la parte final de este texto, argumentamos sobre la necesidad de modificar las restricciones a la publicación de encuestas los días previos a las elecciones, y ofrecemos algunos apuntes para entender las discrepancias observadas entre los resultados oficiales y los publicados por las encuestadoras.

Nuestro modelo de agregación de encuestas vs. resultados de la elección a nivel estatal

En la gráfica 1 reportamos las preferencias estimadas para Delfina Gómez y Alejandra del Moral basados en nuestro modelo de agregación de encuestas. Como explicamos en el texto previo publicado en este Taller de Datos, nuestro modelo únicamente incluye aquellas encuestas que, además de contar con información demográfica del encuestado, indican el municipio en donde viven. También es necesario resaltar que esta última estimación la hicimos pasadas las elecciones ya que, por las restricciones a la publicación de encuestas, aunque estas encuestas se hayan levantado la semana previa a la elección, los datos de estos estudios sólo estuvieron disponibles después del 4 de junio en el portal del Instituto Electoral del Estado de México (IEEM).

Las estimaciones que reportamos en la Gráfica 1 para ambas candidaturas quedaron muy cerca de su votación obtenida (Delfina Gomez: estimada 55.3 %, elección 54 %; Alejandra del Real: estimada 44.7 %, elección 46 %). Para hacer la comparación entre las preferencias estimadas por nuestro modelo y los resultados finales, quitamos los votos nulos y de candidatos no registrados. La última diferencia estimada por nuestro modelo para estas candidatas fue de 10.7 %, una cifra muy parecida al día de la elección que fue de 8 %. En la Gráfica 1 también es interesante resaltar que la diferencia entre Delfina Gómez y Alejandra del Moral se redujo 7.1 puntos respecto de la estimación previa al segundo debate. En otras palabras, las campañas sí afectaron la intención del voto, particularmente en la recta final de la campaña.

Gráfica 1. Preferencia estatal a gobernadora en Edomex
(estimación final y resultado PREP)

Por transparencia, en la tabla 1 reportamos los insumos que utilizamos para la generación del modelo de estimación de preferencias electorales: el número de encuestas incluidas, el número de municipios que fueron incluidos en cada estimación y las observaciones (número de entrevistados). Cabe aclarar que sólo modelamos la elección dentro de cada encuesta por Delfina Gómez o Alejandra del Moral, por lo que la no respuesta, el voto nulo u otra opción fueron excluidos.

Tabla 1. Número de municipios Estado de México, observaciones y encuestas dentro de cada estimación

Estimación	Días previos	Encuestas	Municipios	Observaciones
1	79	1	46	1038
2	75	2	69	1911
3	49	3	70	2797
4	37	4	74	3549
5	20	5	84	4525
6	17	6	84	5448
7	4	10	106	8269

Nuestro modelo de agregación de encuestas vs. resultados de la elección a nivel municipal

En los siguientes mapas mostramos el comparativo entre la candidata ganadora por municipio con los resultados del PREP al 100 % y la ganadora proyectada por nuestro modelo. De los 125 municipios del Estado de México, nuestro modelo logró acertar a la candidata ganadora en 100, es decir, alcanzó una precisión bastante alta del 80 %. Como explicamos en una nota anterior, el diseño muestral de las encuestas que utilizamos en nuestro modelo fue elegido por las casas encuestadoras para estimar las preferencias electorales a nivel estatal. No obstante, con nuestro modelo logramos aprovechar la información de esas encuestas y modelar las preferencias electorales a nivel municipal con un nivel bastante alto de precisión en la gran mayoría de los municipios del Estado de México. La precisión de nuestro modelo de preferencias electorales fue menor en los municipios del norte y oeste de esta entidad.

Mapa 1. Comparativo entre candidata ganadora proyectada y real en los municipios del Estado de México

Resultados a detalle en el Corredor Azul y Corredor Amarillo: Modelo vs. PREP

En la gráfica 2 mostramos el cambio entre la primera estimación que realizamos (después del segundo debate entre candidatas) y la segunda estimación (unos días antes de la elección) en comparación con el voto final recibido en los siete municipios del Corredor Azul.¹ La proyección al día siguiente del segundo debate era que Delfina Gómez ganaría en los siete municipios por una amplia ventaja, excepto en Huixquilucan, situación que cambió en nuestra segunda proyección al actualizar el modelo. De esta forma, nuestro modelo proyectó correctamente a la ganadora de la elección en los siete municipios del Corredor Azul. Únicamente en Huixquilucan y Tultitlán hubo algunas discrepancias en los porcentajes de voto, no obstante, se proyectó correctamente a la ganadora. Al igual que en la Gráfica 1, en la Gráfica 2 también se puede observar que en las últimas dos semanas de la campaña hubo un cambio notorio en la intención de voto con un repunte significativo en los municipios donde triunfó Alejandra del Moral.

Gráfica 2. Preferencia final estimada y voto PREP en municipios del Corredor Azul

De hecho, en un análisis sobre los bastiones partidistas en el Estado de México utilizando la misma técnica que los modelos de intención de voto y publicada también en este Taller de Datos, calculamos que la opinión positiva hacia el PRI-PAN en los municipios del Corredor Azul donde ganó Alejandra del Moral era bastante más alta respecto del promedio estatal: Huixquilucan, Tlalnepantla de Baz, Naucalpan de Juárez y Atizapán de Zaragoza.² Nuestro análisis sugiere que, a pocos días de la elección, la opinión partidista positiva hacia PRI y PAN activó el voto a favor de la candidata de la alianza Vamos por el Estado de México en estos municipios.

Pasando a los municipios del Cinturón Amarillo,³ reportamos una gráfica similar incluyendo la estimación al día del segundo debate y la elaborada con datos previos a la veda electoral. Ambos datos los comparamos con el voto PREP. En la Gráfica 3, de nueva cuenta, observamos que nuestro modelo proyectó correctamente a la ganadora en todos los municipios del Corredor Amarillo. A excepción de Ixtapaluca y Valle de Chalco Solidaridad, la estimación previa a la elección se acercó bastante a los números del PREP, con una diferencia promedio de tres puntos. La tendencia de estos municipios mexiquenses tuvo pocos cambios desde el segundo debate hasta el final de las campañas colocando a Delfina Gómez en primer lugar.

Gráfica 3. Preferencia final estimada y voto PREP en municipios del Cinturó Amarillo

Evaluación del modelo de preferencias electorales para Edomex

Las estimaciones realizadas con las encuestas publicadas a lo largo de las campañas mostraron que la diferencia en la intención de voto entre las candidatas mexiquenses comenzó a disminuir pasado el segundo debate. Aunque nuestra última estimación fue realizada pasadas las elecciones (dado que las bases de datos de las últimas encuestas en el portal del IEEM sólo estuvieron disponibles después de la elección), nuestro modelo proyectó un resultado muy cercano al voto registrado en el PREP. Además, la precisión de nuestro modelo fue aumentando conforme incluímos más encuestas y más cercana estaba la elección.

En la Gráfica 4 hacemos una evaluación de nuestras estimaciones a partir del cálculo de la raíz de las desviaciones del error cuadrático medio (RSEM), medida usada para conocer la precisión de nuestras proyecciones.⁴ Por ejemplo, la primera estimación realizada 79 días antes de la jornada electoral tuvo un error promedio de 13.1 % de los resultados finales, este error se redujo a sólo 0.4 %. La Gráfica 4 muestra la evolución del error en nuestras estimaciones. Nuestro error bajó considerablemente a partir de la tercera estimación y usando sólo tres encuestas (ver tabla 1).

Gráfica 4. Cambio en el error de cada estimación respecto del resultado PREP

Sin embargo, como indicamos en la misma gráfica, el error final de las estimaciones municipales fue mucho más alto que el estimado estatal. Consideramos al menos dos explicaciones para este error. La primera es la concentración de las muestras de las encuestas en algunos municipios. Generalmente los municipios más poblados tienen mayor probabilidad de entrar en el diseño muestral de una encuesta y esto sesga las estimaciones. Dentro de un modelo multinivel las estimaciones de categorías faltantes, en este caso municipios, son acercadas a la media grupal.

La segunda explicación la relacionamos con la falta de información individual en las encuestas utilizadas. Aunque utilizamos sexo y edad para controlar la variación por grupos demográficos, en la literatura se sugiere incorporar otro tipo de datos como la escolaridad del encuestado, su ingreso, religión o identidad partidista. Con esta información es posible controlar la intención de voto por características más detalladas del votante y también, estimar efectos aleatorios más complejos en el mismo modelo multinivel.⁵ Esta información no siempre está disponible en las bases de datos de las encuestas que se suben a los institutos electorales locales durante las elecciones.

Sin embargo, a pesar del tamaño del error estimado a nivel municipal fue posible, como se mencionó al principio de este artículo, acertar a la candidata ganadora en el 80 % de los municipios mexiquenses. Incluso —como se ve en las Gráficas 2 y 3— el porcentaje de voto estimado para Alejandra del Moral y Delfina Gómez tanto en el Corredor Azul como en el Cinturón Amarillo fue bastante cercano al voto final. Esto también muestra que, aun en el supuesto de que las encuestas sobreestimaran o subestimaran la preferencia hacia alguna de las candidatas, el modelo multinivel con postestratificación utilizado permitió corregir los posibles sesgos en la estimación estatal y tener proyección de voto en todos los municipios del Edomex.

¿Tiene sentido prohibir la divulgación de encuestas en los últimos días de la campaña?

Como explicamos anteriormente, cuando incluimos en nuestro modelo de preferencias electorales todas las encuestas que se realizaron unos días antes de la elección, el resultado del modelo es muy parecido a los resultados de la elección. No obstante, mucha de esa información no estuvo disponible los días previos a la elección dada que la ley electoral prohíbe publicar encuestas desde el primer minuto del jueves anterior a la elección.⁶

Sin embargo, como nuestros modelos sugieren, muchos votantes tomaron su decisión electoral en los últimos días de la campaña. Pero las encuestas y modelos de agregación no siempre pueden reflejar esos últimos cambios debido a la prohibición de difundir encuestas. Lo cual aumenta la percepción de error de las encuestas, cuando en realidad tiene que ver, en parte, por la imposibilidad de levantar y difundir estos estudios en los últimos días de la campaña electoral. Esto impacta en la calidad de información que los votantes y candidatos reciben de parte de las encuestadoras y medios de comunicación. Por lo mismo, podría ser deseable extender el periodo de divulgación de las encuestas y únicamente prohibirlo durante el fin de semana cuando la elección se celebra.

Los resultados a detalle de nuestro modelo pueden consultarse aquí.

Daniel Pérez García
Egresado de la licenciatura en Ciencia Política y Relaciones Internacionales en el CIDE e investigador en materia electoral en la firma encuestadora BGC Beltrán y Asocs.

Rodrigo Castro Cornejo
Profesor visitante en la Universidad de Massachusetts-Amherst y profesor-investigador titular (con licencia) de la División de Estudios Políticos en el CIDE.

El contenido de este artículo no refleja la postura institucional de sus empleadores.

¹ Atizapán, Cuautitlán, Cuautitlán Izcalli, Huixquilucan, Naucalpan, Tlalnepantla y Tultitlán.

² Pérez García, D., y Castro Cornejo, R. “¿Cuáles son los bastiones partidistas en el Edomex? Sobre el apoyo electoral a nivel municipal”, nexos, 4 de mayo de 2023.

³ Chalco, Chicoloapan, Ixtapaluca, La Paz, Nezahualcóyotl, Texcoco y Valle de Chalco Solidaridad.

⁴ Shirani-Mehr, H.; Rothschild, D., y Gelman, A. “Disentangling Bias and Variance in Election Polls”, Journal of the American Statistical Association, 113:522, 2018, pp. 607-614.

⁵ Trangucci, R., y otros. “Voting patterns in 2016: Exploration using multilevel regression and poststratification (MRP) on pre-election polls”, arXiv.

⁶ Ley General de Instituciones y Procedimientos Electorales, Capítulo III “De las encuestas y sondeos de opinión”, art. 213, 251 párr. 5-7 y 253.