No es inusual que, durante y después de las elecciones, los partidos políticos manifiesten defensas que resuenan con los intereses de grupos sociales específicos; con ello buscan mantener o sumar más adeptos. En muchos casos, esas defensas se basan en grupos y divisiones preexistentes, definidos por algunos estudiosos como las clases socioeconómicas. Es verdad que los partidos políticos nacieron para encauzar anhelos colectivos, pero también lo es que este principio se desvirtúa cuando los partidos, a fin de mantenerse en el poder, crean argumentos y agendas a modo. En este sentido, las llamadas clases sociales han sido una categoría ampliamente utilizada por los partidos y los políticos para confrontar los intereses dentro de la sociedad, generar adherencia a grupos e instituciones, avanzar sus agendas y aceptar a cuadros políticos que prometen la defensa incondicional de dichos sectores. A unos días de las elecciones intermedias en México, varios analistas indicaron que “la clase media” había castigado a Morena y el presidente López Obrador, en respuesta, criticó a dicha clase por “aspiracional e individualista”. Pero, ¿es realmente cierto que, dentro y fuera de la Ciudad de México, este grupo le dio la espalda al proyecto del actual gobierno?
Es precisamente lo que debe analizarse de las elecciones del 6 de julio. Anticipo la conclusión: lo que se ha dicho sobre las clases socioeconómicas que apoyan o rechazan a Morena no es del todo consistente con la evidencia que sugieren los datos de las urnas, o bien tiene varios matices, lo que a su vez obliga a plantearnos más preguntas: ¿a qué clase social pertenece la mayoría de los electores propensos a votar por Morena, el PAN o el Verde?, ¿es la misma en todos los estados o varía en cada uno?, ¿en dónde obtuvo cada partido su mayor ganancia de la elección de 2018 respecto a la de 2021?, ¿en dónde sufrieron sus peores derrotas?, ¿cómo se redistribuyeron los votos entre partidos de una elección a la siguiente? Y, finalmente, ¿cómo influye el nivel socioeconómico en la participación electoral?
Este texto forma parte de un estudio más amplio que busca contar, con datos, una historia más completa sobre los resultados de las elecciones del 6 de junio. En él se responde a todas las preguntas anteriores utilizando un banco de datos construido con información censal del Inegi de 2020, que se cruzó con el comportamiento de los votantes en las más de 68 000 secciones electorales de México.1 En esta entrega, la primera, se describe la metodología para calcular los estratos socioeconómicos y se presentan los resultados del análisis del voto al cruzarlos con la pertenencia a un grupo socioeconómico. El objetivo principal es identificar qué grupos socioeconómicos votan por cada partido para así dilucidar si lo que sucedió el 6 de julio fue un revés de las “clases medias” contra Morena y su coalición gobernante, y si ese “voto de castigo” se limitó a la capital del país y algunas zonas urbanas o si se extiende a otros estados.
En las siguientes entregas se analizarán las alternancias a nivel seccional por estratos socioeconómicos y por entidad federativa, y se presentará el análisis de la relación entre nivel socioeconómico y participación electoral.

Ilustración: Víctor Solís
Metodología
Los análisis que se han publicado hasta ahora sobre las elecciones de 2021 han servido para entender algunas causas de los resultados y para delinear patrones del comportamiento de los votantes mexicanos. Sin embargo, tienen algunas limitaciones. La primera es que analizan la dimensión socioeconómica a partir de extensiones territoriales amplias –estados, municipios o distritos–, y esto es poco pertinente en países como el nuestro, donde la desigualdad económica y la variación en preferencias partidistas son muy altas incluso al interior de geografías como éstas. Por lo tanto, un análisis no granular será insuficiente para capturar la variación socioeconómica dentro de los enclaves geográficos y para relacionarla con las preferencias por cada partido.
La segunda limitación de la mayoría de esos análisis es que se han concentrado en la Ciudad de México, por lo tanto, cuentan una parte de la historia sin construir una explicación más amplia sobre lo que ocurrió en la elección pasada. La tercera limitación es que utilizan los datos del ejercicio intercensal de 2015 o las estadísticas a escalas geoelectorales que emplean información del Censo de 2010, pero ni una ni otra son del todo precisas porque se separan en cinco o diez años de las características de la población actual.
Para resolver esas limitaciones, este trabajo utiliza la sección electoral como unidad de análisis. La sección electoral es la organización territorial mínima en la que se organizan las elecciones en México. Cada sección electoral se caracterizó a partir del estrato socioeconómico al que pertenece, utilizando los datos censales de 2020.2 Para hacer esto se usó una técnica similar a la empleada por el Coneval y el Conapo para estimar los índices de rezago social y de marginación en cada sección.3 Así, utilizando la técnica de componentes principales, se construyó un índice –al que denomino “índice de bienestar”– y cada sección electoral obtuvo un valor en él. Luego ordené las secciones de menor a mayor valor a partir del índice e hice una partición de la lista nominal en grupos de 10 %.4 A estos grupos los llamo deciles: cada uno representa el 10 % de la lista nominal, no el 10 % de secciones.5 Desde luego, estos deciles de ninguna manera corresponden a los deciles por ingreso que se estiman con la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH). Sin embargo, este ejercicio nos permite ordenar las secciones electorales por grupos socioeconómicos, conocer las características específicas de cada sección electoral y asociar las preferencias partidistas que se revelaron en la votación.
La Tabla 1 muestra algunas características de estos 10 grupos. A manera de ejemplo, el decil X tiene el mayor promedio de años de escolaridad (13.4 años, que equivalen a casi un año completo de licenciatura), mientras que el promedio del decil más bajo es de 6 años (o primaria completa). Lo mismo se aprecia en la falta de acceso a internet: en el primer decil la carencia se extiende en promedio al 90 %, y en el último decil es apenas de 12.8 %. De este modo, para el análisis subsecuente, a cada sección caracterizada por su pertenencia a un decil se le asoció su comportamiento electoral correspondiente reportado por el INE (participación y votación por cada partido).
|
Decil |
Escolaridad promedio (años) |
Porcentaje de viviendas sin acceso a internet (promedio) |
Lista nominal |
Cantidad de secciones electorales |
|
I |
6.3 |
91.8 |
9 117 233 |
9168 |
|
II |
7.4 |
82.9 |
9 113 790 |
7747 |
|
III |
8.1 |
72.6 |
9 120 870 |
6678 |
|
IV |
8.8 |
61.1 |
9 116 725 |
5820 |
|
V |
9.3 |
51.4 |
9 115 662 |
5555 |
|
VI |
9.7 |
43.9 |
9 117 940 |
6048 |
|
VII |
10.2 |
37.6 |
9 118 987 |
6160 |
|
VIII |
10.8 |
31.6 |
9 115 483 |
6504 |
|
IX |
11.6 |
24.2 |
9 118 106 |
6682 |
|
X |
13.4 |
12.8 |
9 118 561 |
6635 |
Ante un concepto tan escurridizo como el de “clases medias”,6 este texto propone un acercamiento de tipo geométrico. Dicho de otro modo, este análisis categoriza a las clases medias por su posición relativa en una medición de bienes materiales, características de las viviendas y acceso a servicios educativos. Así, las “clases medias” están constituidas por las secciones electorales situadas en un rango arbitrariamente definido de la distribución del índice de bienestar (por ejemplo, en los deciles del V al IX de dicho índice).
Al respecto, este estudio no pretende delimitar los umbrales que definen a las clases medias; más bien, ordenar las secciones electorales en función de su nivel de bienestar sirve a otro objetivo: identificar la relación entre la condición de bienestar socioeconómico y el voto partidista. Además, al incluir en el índice tanto características educativas como el acceso a bienes y servicios (por ejemplo, tener automóvil o computadora personal), se incluyen parcialmente los enfoques de trabajos previos –el énfasis de Loaeza en la educación y el de Rubio y De la Calle en el consumo de ciertos bienes–. Esto también sirve para conocer con certeza las características socioeconómicas de cada uno de estos grupos, sin importar sus calificativos (“baja”, “media”, “alta”, o bien, “aspiracional e individualista”). Con base en este ordenamiento y las características de cada estrato, el lector podrá definir el segmento de clases medias como lo crea pertinente.
Resultados
El Panel 1 se compone de varias gráficas, cada una corresponde a un partido distinto. En el eje y se muestra el número total de votos obtenidos a nivel nacional y en el eje x se ordenan esos votos por cada decil del índice de bienestar. Además, cada gráfica compara estos totales en 2018 y en 2021 (el lector puede seleccionar el año a visualizar haciendo click en la leyenda, y hacer selecciones similares en las gráficas subsecuentes)
El primer resultado –y el más evidente– es que Morena consiguió más votos en todos los estratos socioeconómicos, salvo en el de mayor bienestar (el decil X del índice). En este último, el PAN consiguió más de 2 millones de votos, tanto en la elección de 2018 como en la de 2021.
El segundo resultado importante es que, en 2018, Morena tuvo un gran número de votos entre el decil I y el decil VIII. Sin embargo, en 2021 se observa un cambio en este comportamiento: la votación crece del decil I al II (en éste obtiene la mayor cantidad de votos); luego decrece este número en el decil III y se mantiene estable desde el IV hasta el VIII; finalmente, cae en los deciles IX y X.
El siguiente resultado se refiere a la diferencia en el número de votos de un decil a otro. Para Morena, esa diferencia fue pequeña en 2021, salvo en el decil X. Por lo tanto, parece que, en el agregado, el partido no tiene anclado su apoyo electoral en un grupo específico. Entonces, es cierto que Morena concentra las preferencias de los más pobres, pero también las de los deciles intermedios, pues el apoyo se detiene realmente en el decil X.
Por su parte, el PAN consigue pocos votos en los primeros deciles, del I al IV. A partir del decil V, la tendencia empieza a aumentar hasta el decil IX, incluyéndolo. Pero el apoyo realmente se dispara en el último decil, el de mayor bienestar. Curiosamente, los deciles que más apoyan al PRI se encuentran en los extremos de la distribución: el primer decil, el de menor bienestar, es el que más vota por este partido; en los siguientes, baja este número y se recupera hasta el VIII. En otras palabras, la forma de la votación por decil de bienestar para el PRI tiene forma de U, pero con un mayor peso en el voto de los segmentos más pobres.
Con todo, es sabido que en las elecciones intermedias asisten menos votantes que en las presidenciales;7 por eso, al comparar entre ellas, hay que tomar en cuenta dichas diferencias. Sin embargo, si se quiere entender qué grupos le dieron la espalda a cada partido de una elección a otra o, por el contrario, qué grupos decidieron cambiar su voto y respaldar a un partido distinto, es necesario hacer esa comparación. Con ello, se pueden entender las dinámicas del voto de castigo o de apoyo por grupo socioeconómico.
La Gráfica 1 muestra qué porcentaje de votos obtuvo cada partido en cada decil en 2021 como porcentaje del voto que obtuvo en 2018 (a manera de ejemplo, si el PRI obtuvo en el decil I 10 votos en 2018, y 8 votos en 2021 en el mismo decil, la Gráfica 2 mostraría para el PRI un valor de 80 %).
El caso más notable en cuanto a ganancias de una elección a otra es el de MC. Entre 2018 y 2021 su voto creció en todos los grupos socioeconómicos, pero sobre todo en el decil X, donde obtuvo casi 60 % más votación. Como se aprecia, para todos los deciles, el valor está por encima de 100 %. Lo mismo ocurre con los votantes del Partido Verde dentro de los estratos más pobres: en 2021 obtuvo los mayores rendimientos en los deciles más bajos: en el decil I consiguió 32 % más votos; en el decil II, 26 % más; y en el decil III, 8 % más.
Morena, en cambio, pierde más votos de una elección conforme se avanza del decil I al V; luego la caída entre las dos elecciones es más o menos la misma entre los deciles VI a IX, y en el X vuelve a haber un ligero incremento en las pérdidas de votos respecto a la elección anterior, comparado con el resto de los deciles Este comportamiento es similar al del PRD, salvo porque éste perdió entre 2018 y 2021 relativamente más votos en el decil IX que en el X. Aquí habría que acotar que el “efecto AMLO” en 2018 fue histórico y de dimensiones superlativas, y pensar que Morena habría podido repetir esos niveles de votación en 2021 no tendría sentido. En el PAN, en cambio, ocurre lo contrario: la brecha de votos entre 2018 y 2021 se va cerrando conforme aumenta el nivel socioeconómico, e incluso obtuvo 11 % más votación en el decil X; en especial, llama la atención el brinco que presenta en el decil V. En el caso del PRI, se observa que pudo mantener niveles relativamente altos de los votos que obtuvo en 2018 y de manera estable, e incluso aumentó ligeramente su votación en el decil X, pero menos que el PAN.
Al comparar solamente a Morena y al PAN, se observa que el primero fue más efectivo en minimizar la pérdida del voto de los más pobres (deciles I al IV), mientras que el segundo se desempeñó mejor a partir del decil V. Es en este sentido que podría hablarse de que los segmentos medios pudieron haberle dado la espalda a Morena, pues la reducción de votos fue mayor, pero como se señaló anteriormente, sigue obteniendo un volumen de votos muy importante de esos segmentos.
A partir de todos estos resultados, se pueden plantear más preguntas; por ejemplo, ¿cuáles sectores socioeconómicos son más propensos a votar por cada partido, si aislamos el efecto de pertenencia a un sector socioeconómico? O dicho de otro modo: ¿cómo impacta en el voto por partido la pertenencia de las secciones electorales a un grupo socioeconómico?
Para responder, se estimó un modelo de regresión que identifica cuál es el efecto marginal de pertenecer a un decil en el voto por un partido en específico, tomando en consideración el efecto de que una sección se encuentre en una entidad federativa o distrito en particular.8 Para todos los partidos, la base de comparación es el decil I, por lo que el valor marginal de pertenecer a un decil sobre la votación partidista puede interpretarse así: qué porcentaje de votos adicionales recibe en promedio un partido en una sección electoral, por el hecho de que dicha sección pertenezca a uno de los deciles, entre el II al X, en comparación al decil I. El objetivo es simplemente identificar cuál es la forma de la relación entre el nivel socioeconómico y el voto por un partido, tomando en cuenta el efecto que pueda tener el hecho de pertenecer a una geografía determinada.
El Panel 2, compuesto por dos gráficas, muestra los resultados de dicho modelo. Como advertencia para el lector, el valor del eje y (que mide el efecto marginal por estrato) es diferente en cada subgráfico a fin de mostrar la variación en todos los partidos.
Tanto en la elección de 2018 como en la de 2021, la relación entre el voto por Morena y el bienestar socioeconómico tiene una forma de U invertida; esto sugiere que, en el margen, al aislar el efecto de pertenecer a una entidad o distrito en específico, Morena no obtiene más votos de los estratos más pobres, sino de los que se encuentran a la mitad de la distribución. Para 2021, el efecto más grande de un decil en el voto por este partido se encuentra en el V, mientras que el menor efecto está en el decil X. Es muy diferente el caso del PAN, pues a mayor nivel socioeconómico de una sección electoral, mayor es la propensión de votar por el PAN. En cuanto al PRI, ocurre lo contrario: a mayor bienestar socioeconómico, el efecto de pertenecer a un decil alto y votar por el PRI es negativo.
A partir de todos los resultados anteriores, se puede concluir que los datos matizan el argumento más extendido entre los políticos y los articulistas, quienes aseguran que los sectores medios “le dieron la espalda” a Morena. Los estratos más pobres y los intermedios votan en su mayoría por Morena en términos del volumen de votos que recoge de estos sectores, y si bien entre 2018 y 2021 se observó una reducción importante en la votación de los sectores medios, estos, junto con los más bajos, siguen representando su mayor respaldo. Más aún, cuando se hace este mismo análisis con un modelo que controla las variaciones regionales, se encuentra que el mayor efecto en la votación por Morena por pertenecer a un estrato socioeconómico proviene de los sectores medios. En cambio, para el PAN, el mayor efecto se concentra en los sectores con bienestar más alto.
En la siguiente entrega de este análisis se mostrarán las pérdidas y las ganancias de los partidos en términos de las secciones electorales que se arrebataron entre sí –y en función de los estratos socioeconómicos de donde obtuvieron sus victorias–. En la tercera parte se descompondrán los análisis previos para evaluarlos por entidad federativa. Por último, la cuarta entrega analizará la relación entre la participación electoral y la pertenencia a cada estrato socioeconómico, tanto a nivel nacional como estatal.
Aleister Montfort
Cofundador de Entropia Ai. Es maestro en análisis computacional y políticas públicas por la Universidad de Chicago; ha sido científico de datos para el Banco Mundial.
En colaboración con Sergio Bárcena Juárez. Profesor-investigador del Tec de Monterrey y cofundador de Buró Parlamentario.
Agradezco los comentarios de Rodrigo López Lule y Rodrigo Franco. La responsabilidad por cualquier error u omisión es del autor.
1 Una sección electoral es “La fracción territorial de los distritos electorales uninominales para la inscripción de los ciudadanos en el Padrón Electoral y en las Listas Nominales de Electores.” Cada sección tiene como mínimo 50 electores y como máximo 1500.
2 Para estimar los datos censales a nivel sección electoral, se utilizaron los datos de los “Principales resultados por AGEB y manzana urbana” para cada estado, el archivo de los “Principales resultados por localidad (ITER)” a nivel nacional, y los archivos shp de cada entidad del Marco Geoestadístico. Con ellos se realizaron operaciones espaciales en donde cada unidad espacial (localidades rurales, manzanas de localidades urbanas y rurales amanzanadas, o localidades rurales puntuales) fue asignada a una sección electoral. Cuando no podía asignarse a ninguna sección (i.e. si el centroide no se contenía en una sección), la geometría en cuestión se asignó a la sección más cercana. En el caso de las localidades rurales, existen casos en los que una localidad puede abarcar a más de una sección, y viceversa. Para solucionar esto, se realizó una estimación a partir de distribuir uniformemente los valores de las variables censales (a excepción de los datos relativos) según el número de manzanas que tuviera cada sección. De esta forma, a cada registro del marco geoestadístico se le asignó una sola sección que lo contiene. En algunos casos, el valor de una variable sociodemográfica a nivel sección se estimó como un promedio ponderado por la población de cada subunidad geográfica (por ejemplo, años de escolaridad promedio), mientras que en otros se sumaron el número de viviendas con ciertas características dentro de dicha sección (por ejemplo, número de viviendas con acceso a internet). Para más detalles sobre la metodología, favor de mandar un correo a aleister@entropia.ai.
3 Para caracterizar socioeconómicamente a una sección electoral, utilizamos las variables incluidas en el índice de Coneval y, con la idea de generar una mayor varianza entre los grupos menos marginados, agregamos las siguientes variables a las utilizadas por Coneval: 1) Penetración de internet; 2) Pertenencia de automóvil ; 3) Pertenencia de computadora. Una vez que estimamos la primera componente principal, re-escalamos el valor de la componente entre 0 y 100, y partimos a la población de secciones en deciles, en donde un decil concentra 10% de la lista nominal nacional, no el 10% de las secciones electorales… Una manera quizá más precisa para capturar las diferencias de riqueza entre secciones sería utilizar el valor de la propiedad, pero esta información es limitada a la Ciudad de México y algunos otros municipios, y no se puede hacer un análisis extensivo a todo el país.
4 La lista nominal es el registro de todos aquellos ciudadanos que solicitaron su inscripción al Padrón Electoral y ya cuentan con su credencial para votar con fotografía vigente. Otra manera de hacer esta partición es crear grupos buscando que las diferencias o varianza entre sus elementos al interior de cada grupo sea la mínima posible, y que sea la máxima comparada entre grupos. Esta es una aproximación similar a la que se utiliza para caracterizar el nivel de marginación. Aunque esto crearía grupos más homogéneos al interior y diferenciables del resto, pensamos que la partición por deciles es más fácil de entender, y sirve para elaborar los argumentos en torno a la discusión que queremos.
5 Por ello, el número de secciones en cada decil varía, pues la partición por deciles se hizo por el criterio de población (lista nominal) y no por el criterio de número de secciones. Las secciones electorales más pobres, que son regularmente las secciones rurales, tienen en general una menor población y por tanto una menor lista nominal que las casillas urbanas.
6 Soledad Loaeza, en su clásico libro sobre el tema, definió a las clases medias a partir de ciertas características: diversas condiciones materiales de vida, gozan de prestigio laboral, desempeñan un trabajo no manual y viven en el medio urbano, pero la característica principal, en la concepción de Loaeza, es su capital educativo (Loaeza, Soledad. Clases medias y política en México: la querella escolar, 1959-1963, Alicante: Biblioteca Virtual Miguel de Cervantes, 2018). Otros esfuerzos recientes por caracterizar a las clases medias, como el de Luis Rubio y Luis de la Calle, hablan de la emergencia de estas clases en México y las definen, ante todo, por su capacidad de consumo (de viajes, conciertos y otros tipos de ocio). El INEGI, por su parte, ha medido el tamaño de las clases medias; a partir de la ENIGH, ha analizado distintos rubros de gasto para elaborar una estratificación de los habitantes por grupos socioeconómicos. Finalmente, otras aproximaciones reconocen a las clases medias mediante la autoadscripción (Abundis, Francisco (24/jun/2021). “¿Quién es y por quién voto la clase media?”. Al preguntar a las personas a qué clase consideran pertenecer, algunas encuestas han encontrado que 3 de cada 4 votantes del pasado 6 de junio se consideran de clase media.
7 Al menos desde 1997.
8 El modelo estimado tiene como variable dependiente el porcentaje de votación por un partido, y como variables independientes un conjunto de efectos fijos por distrito y por entidad, así como variables dummy para los deciles de bienestar. Los primeros capturan las características de una entidad o distrito en particular sobre el voto por un partido. Por ejemplo, el efecto del voto por Morena por el hecho de tratarse del estado de Tabasco, o por el PAN por tratarse del distrito 9 de la ciudad de México. Las variables dummies para los deciles de bienestar capturan el efecto que tiene el hecho de que una sección pertenezca a un decil de esta distribución sobre el voto partidista. Los parámetros de interés a estimar son los efectos de estas variables de bienestar sobre la votación. Es decir, este análisis “aísla” el efecto puramente socioeconómico de los efectos geográficos. El modelo estimado es una modelo de regresión lineal ponderado por el número de votos emitidos en cada sección. Al incluir las variables de deciles, la categoría de comparación es el decil I.