Este es el quinto artículo de Mitos de la Inteligencia Artificial, una serie que estudia los fundamentos, conceptos y aplicaciones más importantes en inteligencia artificial, machine learning y matemáticas. Puedes encontrar los artículos previos de la colección aquí.
La idea es ofrecer una referencia clara y sencilla que permita comprender, a cualquier lector, el funcionamiento de diversas herramientas que operan a partir del análisis de datos. En la medida de lo posible, se evitará el uso de conceptos grandilocuentes (en la mayoría de los casos no contribuyen a mejorar el entendimiento) y tecnicismos innecesarios pero, si no hay otra alternativa, se ofrecerá una explicación previa con ideas intuitivas y ejemplos.
Si es la primera vez que lees un artículo sobre inteligencia artificial, probablemente sea buena idea revisar antes los textos sobre algoritmos y machine learning, publicados también en esta serie.
Debido al número de publicaciones recientes sobre ChatGPT y sus funcionalidades, podría parecer que la inteligencia artificial sirve únicamente para la creación de modelos de lenguaje de gran tamaño. Sin embargo, además de la IA generativa existen otras áreas (aprendizaje supervisado, no supervisado y reinforcement learning) y aplicaciones de la IA que pueden traer innovación y mejora en nuestras vidas.
Por ejemplo, Google DeepMind presentó GraphCast en noviembre de 2023. Este modelo de inteligencia artificial es capaz de realizar predicciones meteorológicas con hasta diez días de antelación, pero con mayor rapidez y precisión que el High Resolution Forecast, sistema de simulación meteorológica estándar de la industria producido por el ECMWF. Gracias a este avance, DeepMind asegura que será posible ofrecer alertas tempranas de fenómenos meteorológicos extremos, para, por ejemplo, predecir las trayectorias de los ciclones, así como identificar riesgos de inundaciones y temperaturas extremas. En otras palabras, GraphCast es una herramienta de IA con potencial para salvar vidas al ofrecer hallazgos que permiten una mayor preparación.

A pesar de la reciente popularidad de las herramientas de IA, el uso de datos para tomar mejores decisiones en múltiples aspectos de nuestra vida no es algo nuevo. Hace una década no existía ChatGPT y no estaba tan de moda el término “inteligencia artificial” (en ese entonces lo más popular era decir “big data” para referirse a un proceso que utilizara análisis y mucha información; aunque IA y big data sí son conceptos distintos), pero en México ya se desarrollaban proyectos de análisis de datos para evaluar el impacto de huracanes e inundaciones a través de la integración de múltiples fuentes de información y modelos estadísticos.
Para mostrar los resultados de un análisis de datos sobre el impacto de los fenómenos naturales, y a propósito del huracán Otis en Acapulco, en este artículo se estudian las siguientes preguntas: ¿es posible utilizar distintas fuentes de información y herramientas de análisis para evaluar el impacto (al menos, de forma aproximada) de un desastre natural en corto tiempo? ¿Podemos aminorar las consecuencias de un huracán en la población? ¿Las herramientas de IA y un protocolo de análisis de datos puede mejorar la respuesta ante nuevos desastres naturales?
Figura 1: Búsquedas del término “inteligencia artificial” en Google Trends de México desde el año 2004. Se observa que el aumento en el interés sobre este concepto después de agosto de 2022.

Figura 2: Búsquedas del término “big data” en Google Trends de México desde el año 2004. Se observa que el aumento principal de búsquedas ocurrió a finales de 2013 y desde 2016 se mantuvo en cierto intervalo sin otro aumento tan evidente.

Evaluación del impacto de un desastre natural con análisis de datos
Como referencia principal tomaremos “Flooding through the lens of mobile phone activity”, una investigación publicada en 2014 que permitió evaluar el impacto de las inundaciones en Tabasco en el año 2009 (el reporte se encuentra aquí y aquí).
El objetivo del proyecto consistió en evaluar la situación de Tabasco antes y después de las inundaciones, utilizando múltiples fuentes de información e indicadores sobre movilidad poblacional. Uno de los supuestos generales era que, después de un desastre natural, los patrones usuales de movilidad de las personas se alteran; medir este cambio nos permite conocer el grado de impacto que una inundación o huracán tuvo en la población.
En 2013 el Gobierno de México ya contaba con una gran cantidad de datos demográficos y sociales para este tipo de análisis. Sin embargo, para la creación de indicadores sobre el desplazamiento poblacional se tuvo que realizar un acuerdo de investigación con algunos organismos internacionales y empresas privadas.
Este trabajo fue el resultado de una investigación conjunta entre el Gobierno de México, Global Pulse (laboratorio de análisis de datos de la ONU) y un grupo de académicos e investigadores internacionales de diversas asociaciones. Tuve la oportunidad de participar directamente en esta investigación pues entonces me desempeñaba como director de Análisis de Datos en la CEDN de la Oficina de Presidencia de la República. Este equipo estaba encargado de la Política Nacional de Datos Abiertos y de diseñar proyectos y herramientas innovadoras para políticas públicas en México, todo a partir del análisis de datos.
Data Science for Social Good
Para analizar el impacto de las inundaciones en Tabasco se utilizaron, entre otras fuentes, datos de teléfonos móviles, ubicación de antenas telefónicas, imágenes satelitales, información sobre el nivel de precipitación pluvial, el Censo de Población del Inegi e información sobre protección civil (que contenía datos sobre la ubicación de albergues).
Figura 3: Imágenes satelitales antes y después de las inundaciones en Tabasco

Respecto a los datos aportados y funciones principales de los distintos actores institucionales involucrados en el proyecto, vale la pena destacar lo siguiente:
- Gobierno: proporcionó información demográfica y poblacional en formatos abiertos. Formuló distintas preguntas de investigación que permitieron mejorar el diseño y evaluación de políticas públicas.
- Organismo internacional: en este caso Global Pulse de la ONU, se encargó de la dirección técnica de la investigación, apoyado en expertos e investigadores de distintas instituciones, incluyendo el Programa Mundial de Alimentos de Naciones Unidas.
- Telefónica: análisis de información sobre actividad en telefonía celular en forma de registros detallados de llamadas CDR (call detail records). Los CDR son registros digitales de transacciones telefónicas que se generan cuando se conecta un teléfono a la red móvil (antena telefónica), se realiza o recibe una llamada telefónica, o se utiliza un servicio como los mensajes SMS. Para proteger la privacidad de los usuarios, los CDR son agregados y anonimizados.
Este tipo de datos son fundamentales porque permiten estudiar los lugares en donde normalmente se desplaza la población, a través de las antenas telefónicas que utiliza en la red celular (por ejemplo, la antena a la que generalmente se conecta tu teléfono cerca de tu casa o trabajo). La idea es que si la zona en donde habitualmente se desplaza una persona sufre el impacto de una inundación o huracán, las antenas en donde normalmente se conecta su teléfono para hacer llamadas van a cambiar (alejándose a un lugar más seguro hasta que la situación se restablece). Justamente este cambio en los patrones de movilidad y el tiempo que tarda en restablecerse (cuando las personas pueden regresar a sus hogares y lugares de trabajo) pueden ser indicador del impacto de un desastre natural.
Figura 4: Mapas que muestran un cambio en los patrones de movilidad poblacional, con base en la actividad de las antenas de telefonía. En la imagen se muestran los desplazamientos durante las inundaciones en comparación con una fecha aleatoria.

En este punto es necesario aclarar que el Gobierno no tenía acceso a estos datos. El análisis de este tipo de información fue realizado por un grupo de investigadores, coordinados por un organismo internacional. Sin embargo, el Gobierno sí pudo aportar información y, sobre todo, formular las preguntas de investigación que le permitirían diseñar mejores políticas públicas.
Figura 5: Mapa que muestra el nivel de variación en las antenas de telefonía móvil (círculos rojos), la cantidad de población afectada y las áreas inundadas

A este tipo de estudios en donde toda la información se utiliza para mejorar la vida de las personas se le conoce como ciencia de datos para el bien social, o Data Science for Social Good. Existen otras referencias de este tipo de estudios que utilizan información sobre los patrones de movilidad de las personas, incluyendo Flowminder, impacto de la malaria en Kenia, desplazamientos poblacionales e impacto por el terremoto de Haití en 2010 y el convenio “Big Data y Turismo” realizado entre BBVA y Sectur hace algunos años.
Principales hallazgos
Como resultado del proyecto “Flooding through the lens of mobile phone activity”, pueden destacarse los siguientes puntos.
Los datos sobre los usuarios y patrones obtenidos de los CDR son representativos de la distribución poblacional. Se demostró que existe una fuerte relación lineal entre las estadísticas poblacionales del Censo y las estimaciones basadas en datos CDR (por ejemplo, el porcentaje de la población por municipio según el Censo y el porcentaje de usuarios de telefonía móvil era muy parecido). Esta validación muestra la posibilidad de utilizar los datos de telefonía móvil como indicador de la movilidad poblacional en áreas en donde las fuentes no están disponibles o no son confiables.
Figura 6: Comparación entre el número de habitantes por municipio según el Censo oficial y el número de usuarios de la compañía de telefonía móvil. La alta asociación lineal entre ambas variables se establece por una R-cuadrada de 0.97.

Las advertencias de protección civil no son necesariamente una forma efectiva de alertamiento. Por ejemplo, se emitió una alerta de protección civil el día de mayor precipitación. Se podría esperar que tal advertencia impulse la actividad telefónica, pero los grandes picos se observaron únicamente en dos torres de telefonía celular a lo largo de la zona más afectada. Este resultado demostró que las advertencias de emergencia que se enviaron no causaron un impacto significativo.
Figura 7: Gráficas que indican el nivel de variación en los patrones de actividad telefónica en seis antenas. El área en color azul representa el nivel de precipitación pluvial y las líneas rojas representan la variación en los patrones de actividad telefónica.

La actividad móvil puede proporcionar señales del impacto de una inundación: en las torres telefónicas que no mostraron un aumento en la actividad móvil durante la advertencia de emergencia (que indicaría que las personas que hacen llamados a difundir la alerta), el retraso entre las precipitaciones más altas y la actividad móvil máxima (ocurrida posteriormente a las inundaciones) era normalmente de cuatro días. Esto podría significar que las personas se comunicaron más como resultado de los impactos de inundaciones, mientras que el aviso de protección civil no generó niveles similares de conciencia.
Figura 8: Carretera Federal 180 completamente inundada

La mayoría de las llamadas se realizaron desde las áreas más afectadas: se determinó que las torres telefónicas con mayores variaciones en el número de llamadas realizadas durante las inundaciones se ubicaban en los lugares más afectados.
Figura 9: Mapa dinámico que muestra el nivel de variación en la actividad de telefonía celular (CDR) en distintos municipios de Tabasco. Se puede apreciar que esta variación es tan grande (o incluso mayor) que en Navidad, periodo que se caracteriza por un alto uso de actividad celular (llamadas, mensajes, entre otros).
El análisis de la actividad móvil durante las inundaciones, y la identificación de torres de telefonía celular en las zonas más afectaddas, puede utilizarse para localizar áreas dañadas, evaluar eficientemente las necesidades y asignar recursos (por ejemplo, envío de suministros a las zonas afectadas). En general, esta investigación demostró que los datos de los teléfonos móviles tienen el potencial para proporcionar información en tiempo real sobre el comportamiento humano para mejorar la gestión de emergencias y la respuesta humanitaria.
Figura 10: Actividad telefónica medida con el número de llamadas (línea azul) en antenas cercanas a los lugares de inundación en Tabasco. La franja amarilla indica el periodo en el que ocurrieron las inundaciones.

Como una observación personal y adicional a las conclusiones anteriores, este tipo de estudios también podrían ayudar a determinar un intervalo sobre el tiempo esperado en que las personas tardan en regresar a sus hogares, la distancia promedio en la que se desplazan después de una inundación o incluso la ubicación óptima de albergues temporales una vez que se analizan los datos de los CDR y la información demográfica.
En términos matemáticos, también sería posible estimar una distribución estadística de los factores anteriores, analizando los datos de otras inundaciones y desastres naturales en México. Este tipo de insumos sería un recurso valioso para el diseño de nuevos protocolos de protección civil y alertamiento.
La toma de decisiones con base en análisis de datos requiere capacidades institucionales, políticas e infraestructura tecnológica para poder funcionar. El estudio sobre las inundaciones en Tabasco evidenció el valor potencial de la colaboración público-privada para analizar datos móviles e información demográfica. Idealmente, debería existir un marco de asociación oficial entre el gobierno, organismos internacionales y el sector privado para que este tipo de evaluaciones pueda realizarse de forma inmediata a partir de un desastre natural.
En conclusión, si bien la inteligencia artificial puede contribuir a mejorar nuestra calidad de vida con mejores predicciones sobre la evolución de un fenómeno natural, lo más importante es que estas herramientas realmente se utilicen para tomar mejores decisiones. El caso descrito en este texto fue publicado hace casi diez años y representa un claro ejemplo de cómo la tecnología y los datos pueden ayudarnos.
Sería muy relevante retomar este tipo de iniciativas, o mejor aún, que como país contemos con una oficina pública que esté concentrada en la creación e implementación de este tipo de herramientas para mejorar el bien común. De hecho, los beneficios de este tipo de proyectos no sólo pueden ayudar en el tema de desastres naturales sino en otros aspectos como la salud pública, seguridad, desarrollo económico, turismo, entre muchas otras áreas.
Carlos Castro Correa
Licenciado en Matemáticas Aplicadas y Maestro en Ciencia de Datos por el Instituto Tecnológico Autónomo de México. Consultor, conferencista y profesor de Análisis de Datos e Inteligencia Artificial en distintos programas de Maestría del ITAM.
Agradezco a Sebastián Garrido de Sierra por sus comentarios y observaciones.