Noticias

Investigadores de EGobiernoyTP participan en Data Day: Ciencia de Datos desde el Corazón Industrial de México

05 de Noviembre de 2024
img_1

El pasado 5 de noviembre, la sede de Monterrey de la Escuela de Gobierno y Transformación Pública fue anfitriona del Data Day, una de las conferencias más relevantes en América Latina para profesionales en ciencia de datos. El evento comenzó con la bienvenida por parte del decano Miguel Santos, quien resaltó la importancia de la ciencia de datos en la transformación de nuestras organizaciones y en la creación de soluciones innovadoras para los desafíos actuales. 

 

Este evento anual brinda una plataforma para que líderes, científicos e ingenieros de datos exploren estrategias, técnicas y herramientas de vanguardia en el ámbito de los datos y el machine learning, con el objetivo de mejorar procesos organizacionales y contribuir a una toma de decisiones informada.

 

Durante el evento, investigadores de nuestra institución compartieron sus conocimientos y proyectos, abordando temas de gran relevancia para el contexto actual y futuro de la ciencia de datos en México y América Latina. Participaron:

 

Adolfo De Unánue: Una Discusión sobre Diseño de Aplicaciones con LLMs y Agentes. La presentación de Adolfo exploró los desafíos y principios clave para diseñar aplicaciones de IA basadas en Grandes Modelos de Lenguaje (LLMs) y agentes autónomos, subrayando tres pilares esenciales: estabilidad, adaptabilidad y complejidad. A través de conceptos como funciones de Lyapunov para asegurar estabilidad, estructuras disipativas para adaptabilidad y la cibernética organizacional de Stafford Beer, Adolfo explicó cómo crear aplicaciones robustas y éticamente alineadas.

 

Destacó que el diseño de estas aplicaciones debe buscar un equilibrio entre reducir la variedad para mantener la estabilidad y aceptar la variabilidad intrínseca de los LLMs, lo cual permite responder eficientemente a entornos complejos y dinámicos. Su análisis sugiere que, para aplicaciones interactivas con humanos, es esencial abrazar la flexibilidad y complejidad humana como parte del sistema, permitiendo así una sinergia entre máquinas y personas en la resolución de problemas.

 

Gonzalo Peraza: Sistema de Información Urbano Metropolitano y la Expansión Urbana de Monterrey. Gonzalo presentó el Sistema de Información Urbano Metropolitano (SIUM), una plataforma desarrollada para analizar la evolución de Monterrey en las últimas tres décadas y su expansión urbana acelerada. Utilizando datos abiertos y análisis estadístico avanzado, el SIUM permite visualizar el impacto del crecimiento urbano, como la concentración de empleos en el centro y el desplazamiento de población hacia las periferias. 

 

La plataforma integra datos de censos del INEGI, encuestas de origen-destino y estadísticas del C5, proporcionando un diagnóstico preciso y una narrativa clara sobre los retos de accesibilidad, desigualdad y tiempo de traslado en la Zona Metropolitana de Monterrey. Al final de su charla, Gonzalo presentó tres escenarios de urbanización hasta el año 2070, desde un modelo inercial hasta un escenario controlado que redensifica zonas céntricas—destacando cómo el SIUM facilita una planificación urbana sostenible basada en datos.

 

Elena Villalobos: Ciencia de Datos en la Logística Portuaria. Elena compartió su experiencia en el desarrollo de un producto de datos que optimiza la logística en terminales portuarias, específicamente dirigido a reducir los movimientos de reacomodo al estibar contenedores. Al analizar estos movimientos mediante técnicas de aprendizaje de máquina, se ha logrado predecir el tiempo de estadía de los contenedores y determinar la probabilidad de que requieran servicios aduanales. Utilizando teoría de grafos para unificar el catálogo de consignatarios y técnicas de procesamiento de lenguaje natural para clasificar mercancías, se han estimado mejoras en la eficiencia de las operaciones portuarias. 

 

Villalobos destacó que este producto se integra mediante una API directamente en las operaciones de las terminales, permitiendo un acceso inmediato y mejorando el flujo logístico. Esta solución ha demostrado ser efectiva en la industria al incrementar la eficiencia y reducir costos operativos.

 

Paola Abril Campos: La Transformación Digital de los Sistemas de Salud. Abril exploró los desafíos y oportunidades en la digitalización del sistema de salud en México y América Latina, resaltando el papel de los datos para una mejor comprensión de las necesidades de las personas. Subrayó que la falta de acceso a historiales clínicos y la ausencia de datos en tiempo real son obstáculos importantes, especialmente en un sistema de salud fragmentado y con encuestas costosas que dificultan la recopilación continua de información. Ante este panorama, Campos abogó por un cambio de paradigma hacia los learning health systems, sistemas de salud que integran el conocimiento generado en la práctica cotidiana para mejorar la atención y los resultados de salud.

 

Abril concluyó que, aunque se ha dado un paso inicial en la conectividad, los resultados han sido subóptimos, y la digitalización sigue siendo una necesidad pendiente para mejorar la calidad de los servicios de salud.

 

Hermilo Cortes: Taller de DataFrames de Alto Rendimiento con Polars. Hermilo dirigió un taller interactivo sobre Polars, un framework en Rust diseñado para el manejo eficiente de datos estructurados. Polars aprovecha la paralelización multicore y optimiza la memoria a través de evaluaciones lazy, mejorando significativamente los tiempos de procesamiento en comparación con frameworks tradicionales como Pandas. 

 

Durante el taller, los asistentes compararon tareas comunes de manejo de datos entre Pandas y Polars, experimentando las ventajas de esta biblioteca en términos de velocidad y simplicidad. Además, Cortes explicó cómo Polars puede integrarse en flujos de trabajo de análisis de datos complejos, permitiendo realizar el procesamiento pesado en Polars y la visualización final en Pandas. La sesión demostró el potencial de Polars para aplicaciones que requieren un rendimiento optimizado en el manejo de grandes volúmenes de datos.

 

Data Day 2024 se ha consolidado como un evento de referencia en la ciencia de datos en América Latina, generando un espacio de intercambio para la investigación y la innovación. Las contribuciones de nuestros investigadores reflejan nuestra visión de mover las fronteras del conocimiento para impactar en el espacio público.