Notas sobre una elección difícil (de predecir)

Donald Trump sometió su desempeño al escrutinio de los votantes norteamericanos. La elección resultó más cerrada de los previsto y, a una semana de la elección, hay un claro ganador, pero la batalla legal por los resultados apenas comienza. Parto de la sobreestimación del apoyo a Joe Biden que hicieron los modelos de agregación de encuestas para discutir varios factores que afectaron las mediciones. Al final discuto las complicaciones que resultan de la interacción entre fenómenos tan complejos como un contexto electoral competitivo, donde los ciudadanos desconfían del gobierno y los perdedores rechazan su derrota electoral.

Ha sido una semana tan llena de tumultos que bien vale recordar la secuencia de los eventos. El lunes 2 de noviembre nos dejó con los pronósticos más halagüeños para Biden y los demócratas: una “ola azul” que los dejaría con el control, incluso, del Senado. Los modelos predictivos y los agregadores de encuestas cerraban la campaña diciendo que Biden tenía 87 % (Fivethirtyeight) o 97 % de ganar la elección (The Economist) y el promedio de encuestas de intención de voto de RealClearPolitics (RCP) cerró con una ventaja de 7.2 puntos. Por ejemplo, según FiveThirtyEight, la probabilidad de la victoria de Biden (89 %) se traducía en una ventaja predicha de 8 puntos en el voto emitido y de recibir 348 votos del colegio electoral. The Economist le auguraba una ventaja de 8.8 puntos y 356 votos del colegio electoral. Pero cuatro años antes ya nos habían dicho que Hillary Clinton arrasaría las elecciones y Trump ganó. Era prudente, por lo tanto, tomar las predicciones con cuidado.

Es importante notar que discuto los resultados agregados o modelados porque sus insumos son las encuestas que miden las preferencias electorales y porque agregar los resultados da una idea más clara (aunque imperfecta)de la tendencia general de la opinión pública y su incertidumbre. Y sus resultados contrastan con una elección mucho más competida. Las idiosincrasias del colegio electoral, el número históricamente alto de votos emitidos por correo y en persona y la pandemia que encerró a muchos contribuyeron a un resultado electoral indiscutiblemente favorable para Biden, pero con una ventaja menor a la predicha. Esta diferencia puede parecer trivial (son sólo unos puntos porcentuales), pero tiene consecuencias políticas muy importantes para la fuerza que tendrá cada partido en el Congreso y en los estados.

¿Significa esto que las encuestas o los modelos de agregación “se equivocaron”? No. Alejandro Moreno publicó un análisis de los resultados de en los estados más competitivos y encontró que las diferencias no son particularmente mayores a las que resultaron en la elección pasada. Encuestas y modelos hicieron bien su trabajo, pero enfrentan retos que es necesario atender para mejorar la medición de actitudes políticas en Estados Unidos y en el resto del mundo. Y, en particular, los resultados de esta elección llaman la atención a fenómenos políticos que nos atañen a todos y a nuestra capacidad para entenderlos.

Ilustración: Patricio Betteo

Educación

Por segunda vez consecutiva, las encuestas (y los modelos que alimentan) subestimaron el apoyo electoral para Donald Trump. En 2016, esta subestimación causó una sorpresa fulminante porque fue particularmente aguda en los estados del “muro azul” (Michigan, Pennsylvania y Wisconsin) en el medio oeste que habían votado consistentemente por Barack Obama por dos elecciones. Esta ceguera fue causada por un problema metodológico: las encuestas levantadas en esos estados eran pocas y el diseño de sus muestras no consideró el hecho de que los votantes con menos educación preferían más a Trump pero suelen responder encuestas con menor frecuencia.

En las muestras de cada encuesta, aunque aleatorias, había menos entrevistados con educación menor a la universitaria y, por ello, la proporción de votos por Trump resultó menor. Mientras que los encuestadores solían ponderar sus resultados relativos a proporciones de edad, sexo o región, la correlación entre educación y preferencia no fue corregida. Estos sesgos de no respuesta fueron revisados este año y, aún así, el sesgo persistió.

Es posible que en esta campaña las diferencias de preferencias electorales entre niveles de educación hayan resultado más complejas o que sus efectos no fueran iguales entre diversos grupos sociales. Un encuestador puede corregir estos errores sólo si anticipa que serán importantes y no es fácil (ni barato) diseñar una muestra compleja que le permita medir todas las interacciones concebibles entre un número grande de factores que pueden resultar importantes o no. Generalmente, ajustes por grupos de edad, sexo, geografía y, sí, educación, permiten hacer estimaciones suficientemente precisas, en tiempos y con muestras razonables.

Voto

No es fácil predecir quién irá a votar el día de la elección. Hay una gran variedad de herramientas que permiten estimar la intención de voto y calcular las proporciones de votantes que recibirá cada partido. Ninguna de estas es infalible porque las personas pueden olvidar o no poder acudir a las urnas el día de la elección, o, como es posible en Estados Unidos, registrarse el mismo día de la elección (como en Michigan). En tiempos normales, las variaciones en la participación electoral son pequeñas y aleatorias porque algunos que lo tenían planeado no van a votar, otros descubrieron que sí querían votar a último minuto. Generalmente no afectan ninguna medición en particular. Pero esta no fue una elección normal por muchas razones.

En primer lugar, la pandemia afectó la capacidad de la gente de salir a la calle a votar. Semanas antes de la elección muchos ciudadanos norteamericanos pidieron sus boletas por correo, a lo que Trump respondió insinuando que podrían ser vectores de fraude en su contra. Las boletas enviadas por correo resultaron mayoritariamente usadas por votantes demócratas, lo que tuvo dos consecuencias importantes. En primer lugar, no quedó claro cuáles encuestadores ajustaron sus estimados a quienes ya habían votado o apenas consideraban votar, lo que posiblemente sesgó la proporción de demócratas estimados. En segundo lugar, en la mayoría de los estados (como en Pennsylvania) los votos emitidos de forma presencial serían los primeros en ser contados y serían mayoritariamente republicanos. Parte del desconcierto con las encuestas registrado en los días siguientes a las elecciones fue causado por la diferencia entre las expectativas generadas por las proyecciones y los primeros resultados desfavorables.

En segundo lugar, en los últimos días de la elección una encuesta (de la famosa encuestadora Ann Selzer) que en septiembre había registrado a ambos partidos empatados en Ohio registró un aumento repentino en la intención de voto por Trump. Estos cambios pueden deberse a una muestra que aleatoriamente resultó particularmente republicana, pero también pueden ser una señal de movimiento de último momento. Los republicanos habían demostrado estar menos preocupados por la pandemia porque el gobierno de Trump había enviado señales muy ambiguas al respecto. En consecuencia, resultó esperable un aumento en el voto republicano el día de la elección que decidió acudir al último minuto, posiblemente atizados por la amenaza de una “ola azul” que ya había sido cantada por las encuestas.

Incertidumbre

Las encuestas y los modelos de agregación son herramientas de investigación social y política que han resultado, en forma no trivial, víctimas de su propio éxito. Por décadas, la narrativa que establecen los medios sobre las elecciones ha incorporado los resultados de encuestas como contenidos demandados por el público. Las audiencias quieren saber quién va a ganar, con la mayor certidumbre posible. Las encuestas y los agregadores¹ hacen el mejor trabajo posible para medir las preferencias de una muestra o de un conjunto de ellas, junto con la incertidumbre asociada a estas mediciones. Las audiencias que demandan proyecciones electorales y encuestas, sin embargo, son poco tolerantes a las discusiones sobre incertidumbre, especialmente porque involucran conceptos y técnicas matemáticas y probabilísticas con las que mucha gente no está familiarizada.

El reto para comunicar la incertidumbre y evitar interpretaciones erróneas de los resultados que la describen es considerable, especialmente cuando se trata de estimaciones complejas, como las de un modelo de agregación de encuestas. Es importante notar que tanto FiveThirtyEight como The Economist han hecho un trabajo ejemplar en producir información visual que comunique la incertidumbre asociada a sus predicciones. Sin embargo, hay indicaciones serias de que las estimaciones probabilísticas (“tal candidato tiene x % de ganar la elección”) que producen los modelos tienen el efecto indeseado de generar una interpretación equivocadamente certera del resultado de la elección y, con ello, reducir la intención de salir a votar el día de la elección entre quienes creen que su candidato será el ganador. Para evitar estas malas interpretaciones entre los votantes, las estimaciones probabilísticas del Economist serán descontinuadas.

Otros efectos contextuales que vale la pena considerar son los que tuvo el esfuerzo de movilización de la campaña de Trump en comunidades de ascendencia latinoamericana, como en el sur de Texas o en Florida. Así como Biden logró recuperar a los votantes blancos del “muro azul”, también Trump logró que los hispanos de Florida y Texas votaran por él. Estos efectos de campaña pueden ser difíciles de medir en poblaciones pequeñas o en grupos que suelen aceptar con menor frecuencia la invitación para participar en una encuesta. En Estados Unidos se ha observado que tienen una menor probabilidad de responder una encuesta los hombres, los hispanos y, como ya los discutimos, quienes tienen menor nivel educativo. No sería sorprendente que el crecimiento entre estos grupos, por ejemplo en Texas, no fuera medido correctamente por las encuestas.

Actitudes antisistémicas

Para terminar, es necesario discutir el fenómeno de los llamados “trumpistas tímidos”, aquéllos que supuestamente escondieron sus preferencias a los encuestadores para salir a votar por Trump. En 2016 no hubo mucha evidencia de que existieran, aunque desde entonces se ha especulado que el voto por un candidato desaprobado por el círculo social de los entrevistados podría no ser reportado con sinceridad a un encuestador por considerarlo “políticamente correcto”. Es posible que este fenómeno sea una manifestación de algo más generalizado: una correlación entre las actitudes antisistémicas, como la desconfianza en las instituciones como el gobierno y, en particular, las encuestas, con la propensión a responderlas sinceramente o responderlas del todo.

Estos sesgos en la respuesta han sido observados ya otros países y resultan esperables del ambiente de polarización política que acompaña el ascenso de políticos de corte populista, en los que los ciudadanos son bombardeados repetidamente con mensajes, emitidos por los mismos gobernantes, sobre los motivos para desconfiar del gobierno o de las encuestas. La correlación de la respuesta con el nivel educativo, discutida arriba, puede ser mitigada con un ponderador que ajuste la muestra a las proporciones conocidas en la población. Pero no es posible hacer lo mismo para mitigar sesgos inducidos por actitudes anti-sistémicas porque no conocemos las proporciones en la población de estas actitudes y, más grave aún, porque muy probablemente cambien en respuesta a mensajes políticos.

Este sesgo sería particularmente problemático en un ambiente polarizado, en el que ciertos grupos de votantes están expuestos a mensajes críticos a ciertas instituciones de gobierno o a las encuestas (que “están cuchareadas”, por ejemplo). En estos días he escuchado información anecdótica (comunicaciones de amigos y tuits) que sugiere que los medios de comunicación preferidos por los republicanos, como Fox News, han recomendado a sus audiencias no responder encuestas. ¿Serían estos mensajes, por sí mismos, capaces de causar sesgos en las encuestas? No por completo, pero creo muy posible que tuvieran un efecto sistemático en un sector particularmente desconfiado de su audiencia. Este sesgo, aunque pequeño, puede tener consecuencias notorias. Si los encuestados con baja educación escucharon a un presidente atacando a los medios y a las encuestas (que ya vaticinaban su derrota), la respuesta a la encuesta estaría sesgada a favor de Biden porque los que prefieren a Trump no respondieron. Este sesgo podría ser amplificado por la ponderación de educación porque quienes sí respondieron a favor de Biden recibieron más peso del necesario. Análisis de los resultados arrojarán más luz sobre esta pregunta.

Por lo pronto, vale la pena considerar las consecuencias que puede tener este error de medición. Este sesgo, de ser común a otros países cuyos candidatos o líderes son críticos a las instituciones, complica las mediciones sobre las actitudes de la ciudadanía sobre la confianza en el gobierno. De la misma forma, pueden alterar las proporciones de apoyo estimado por un candidato populista que critica las encuestas que le son desfavorables.

Si algo hemos aprendido en estos años es que un segmento de los ciudadanos responde favorablemente a acusaciones de fraude hechas cuando su candidato pierde la elección. Como nos lo ha demostrado Trump, hacer una acusación de fraude después de una derrota electoral puede ser útil para la popularidad y prospectos políticos del perdedor. Este tipo de discurso populista que utiliza la desconfianza ciudadana como ariete político tiene una audiencia natural que incentiva su uso. Este fenómeno amerita una discusión mucho más profunda, pero baste por el momento traerlo a colación del problema metodológico que puede significar el sesgo que dicho discurso puede inducir en la medición de su popularidad, casi como si miramos el contenido de un barril y no podemos encontrar el fondo.

Salvador Vázquez del Mercado
Profesor-investigador del LNPP/ CIDE

¹ Yo me cuento entre ellos: colaboré en el diseño del agregador de encuestas para Bloomberg México para la elección presidencial de 2018.