Data and Code


In the end you should only measure and look at the numbers that drive action, meaning that the data tells you what you should do next.

– Alexander Peiniger

SeGuía:

SeGuía es un proyecto que tiene como objetivo intentar abordar el problema de las sequías en México desde la raíz, a través de un modelo predictivo el cual generará un coeficiente respecto a la probabilidad de que exista una sequía en el siguiente mes. Este proyecto fue liderado por la licenciada Ana Sofía López Zúñiga y por mí, con el apoyo adicional de Alan Jesús Cortés de la Torre, Maximiliano Bernal Temores, Guillermo León Silva Ocegueda y Daniel Caldera Hernández.


Hacia el entendimiento de las remesas y la inclusión financiera:

Este proyecto surgió para la tercera edición del Desafío Data México, dónde se habló sobre la inclusión financiera y las MIPYMES; el cual fue organizado por la secretaría de economía. Los integrantes que desarrollaron el proyecto fueron Raúl Sánchez, Omar Peña, y yo. Y en esta ocasión nuestros esfuerzos nos permitieron obtener el tercer lugar a nivel nacional.

En este proyecto, se buscaba determinar la existencia de alguna relación entre las remesas y la inclusión financiera. Para esto, realizamos técnicas de aprendizaje automático que nos permitían, de manera sistemática, identificar las relaciones entre estos dos conceptos haciendo uso de modelado estadístico.

En específico, utilizamos la técnica de explicabilidad de modelo de aprendizaje automático conocida como SHAP. Para lograrlo, generamos un modelo de regresión el cual tenía el objetivo de predecir el valor de las remesas enviadas en cada municipio cada mes solamente incorporando información de inclusión financiera en México; es decir, acceso a bancos, tarjeta de crédito y distintas herramientas financieras como créditos e hipotecas. Esto proporcionó el insumo necesario para utilizar la técnica de explicabilidad para entender las razones de las predicciones.

Si desean consultar el código, les proporciono el link a GitHub donde está disponible el repositorio completo.

https://github.com/dhdzmota/rulo_mota_omath/tree/develop

Adicional a esto, me tomo la libertad de proporcionarles las diapositivas que utilizamos al exponer el proyecto así como el video de la presentación (del minuto 1:09:11 al 1:16:13).


Intensive Care Unit Occupancy:

Este proyecto surgió para un concurso llamado Desafío Data México; en su segunda edición, organizado por la secretaría de economía. Los participantes fuimos Raúl Sánchez, Omar, Alberto y yo. En este caso este proyecto buscaba describir lo que estaba ocurriendo en México respecto a la pandemia desde distintos puntos de vista; nosotros decidimos hacer un modelo predictivo. El concurso duró aproximadamente una semana, por lo que tuvo que ser un desarrollo constante y eficaz, y gracias a nuestros esfuerzos, alcanzamos llegar al segundo lugar a nivel nacional.

En este proyecto, se buscaba tener un modelo de aprendizaje automático con la capacidad de predecir la probabilidad de tener una ocupación crítica en alguna unidad de cuidados intensivos (UCI) dentro del contexto de la pandemia del COVID-19. Se buscaba que las predicciones fueran disponibles en tiempo real para los siguientes 15 días.

Si desean consultar el código, les proporciono la página web donde se encuentra el repositorio disponible.

https://github.com/dhdzmota/omath_mota_rulo

Adicional a esto, les comparto las diapositivas que utilizamos al exponer el proyecto así como el video de la presentación (del minuto 29:00 al 43:30).

Hacia la predicción de la ocupación de las unidades de cuidado intensivo.

Whatsapp

Netflix