Noticias

Regresa el Data Pub en 2025 con conversación sobre la exploración de la analítica predictiva

29 de Enero de 2025
data_pubenero

El pasado 29 de enero, la Escuela de Gobierno y Transformación Pública del Tecnológico de Monterrey, en su sede Mixcoac, fue el escenario de la edición de enero del Data Pub. En esta ocasión, la sesión estuvo dedicada al análisis del proyecto ganador del segundo lugar en el Factored Datathon 2024, desarrollado por el equipo LatamFusion.

 

El evento tuvo como objetivo explorar la solución construida por LatamFusion, que integra un flujo automatizado de analítica predictiva aplicada a datos masivos. El proyecto abarcó desde la descarga e ingesta diaria de nuevos datos hasta la generación de alertas mediante la predicción de series de tiempo. Se hizo uso de tecnologías avanzadas como Azure Functions, Docker, SQL Server, CI/CD, Machine Learning y Databricks. La solución final se presentó mediante un aplicativo web en Streamlit. Además de los aspectos técnicos, se reflexionó sobre las estrategias de trabajo colaborativo que permitieron el éxito del equipo.

 

El evento contó con la participación de César Arroyo Cárdenas, Coordinador de Ciencia de Datos en Distribuciones Cantilever. Su experiencia en ciencia de datos, aplicada a sectores como la industria eléctrica, el IoT y la cosmología observacional, aportó una perspectiva enriquecedora sobre los retos y aprendizajes del Datathon. Su presentación permitió entender la metodología de trabajo detrás del proyecto, así como las claves para desarrollar soluciones innovadoras en un entorno competitivo.

 

Durante la charla se abordaron también aspectos fundamentales del reto Predicting Global Risk, que buscaba generar un producto capaz de transformar datos crudos en alertas tempranas sobre riesgos globales. César mostró evidencia del trabajo con la base de datos GDELT, que monitorea eventos a nivel mundial desde 1979 y del trabajo con limpieza en capas, cálculos de GoldsteinScale por país y modelos predictivos como ARIMA, Random Forest y XGBoost. 

 

Entre los aprendizajes compartidos, se destacó la importancia del trabajo en equipo, la necesidad de definir objetivos claros y la flexibilidad para adaptar estrategias según el desarrollo del proyecto. También se mostró el desarrollo de un sistema de visualización dinámica para clasificar alertas y representar predicciones geoespaciales. Se enfatizó la relevancia de la integración de modelos de lenguaje en soluciones analíticas y la importancia de la rápida iteración en proyectos de datos.

 

Tras la presentación, los asistentes participaron en una sesión de preguntas y respuestas, seguida de un espacio de networking que permitió el intercambio de ideas y experiencias con el expositor. El Data Pub se consolida en la generación de conocimiento aplicado y siendo un espacio para la formación de líderes capaces de transformar su entorno mediante el uso de la ciencia de datos y la innovación tecnológica.